14.2.1 什么是URL

14.2.1 什么是URL

URL(Uniform Resource Locator)是统一资源定位器的简称,它表示Internet上某一资源的地址。通过URL我们可以访问Internet上的各种网络资源,比如最常见的WWW,FTP站点。浏览器通过解析给定的URL可以在网络上查找相应的文件或其他资源。

URL的基本结构由4部分组成:

<协议名>://<主机名>:<端口号>/<文件名>。

1.传输协议(protocol)

传输协议有:http、ftp、file和gopher等,默认为http协议。注意:协议名后是冒号加双斜杠(://)。

2.主机名(hostname)

网络地址的助记名,按照域名进行分级管理,可以是IP地址,也可以是计算机的名称或域名。如:

http://www.sun.com

http://172.17.98.1

ftp://fpt.pku.edu.cn

3.端口号(port number)

一个计算机中可能有多种服务,如Web服务、ftp服务或自己建立的服务等。为了区分这些服务,就需要使用端口号,每一种服务用一个端口号,范围是0−65535。

如果没有指明端口号,则使用服务文件中服务器的端口。每种协议有一个缺省的端口号,在端口号未指明时使用该缺省端口号。常用服务器默认端口号如表14-1所示。

表14-1 常用服务器默认端口号

img610

例如,http://www.sun.com:80

等价于:http://www.sun.com

4.文件名(filename)

文件名包括该文件的完整路径。在http协议中,有一个默认的文件名是index.html,因此,下列两者等价:

http://www.sun.com

http://www.sun.com/index.html

URL是最为直观的一种网络定位方法。使用URL符合人们的语言习惯,容易记忆,所以应用十分广泛。而且在目前使用最为广泛的TCP/IP中对于URL中主机名的解析也是协议的一个标准,即所谓的域名解析服务。使用URL进行网络编程,不需要对协议本身有太多的了解,功能也比较弱,相对而言是比较简单的,所以在本章我们先介绍在Java中如何使用URL进行网络编程。