了解网址(Understanding URL)
Web上的每个文档都有一个唯一的地址。 该地址称为U niform R esource L ocator(URL)。
多个HTML/XHTML标记包含URL属性值,包括超链接,内嵌图像和表单。 所有这些都使用相同的语法来指定Web资源的位置,而不管该资源的类型或内容如何。 这就是为什么它被称为统一资源定位器。
网址元素
URL由多个部分组成,每个部分都向Web浏览器提供信息以帮助查找页面。 学习URL的各个部分比较容易,如果查看下面给出的示例URL,则有三个关键部分:方案,主机地址和文件路径。 以下部分将讨论它们中的每一个:
<span style="color:red;">http://</span><span style="color:blue">www.xnip.cn</span><span style="color:green">/index.htm</span>
方案
该方案标识了您要链接的协议和URL的类型,因此,应该如何检索资源。 例如,大多数Web浏览器使用超文本传输协议(HTTP)传递信息以与Web服务器通信,这就是URL以http://开头的原因。
还有其他方案,您可以根据您的要求使用其中任何一种:
Sr.No | 方案和说明 |
---|---|
1 | http:// 超文本传输协议(HTTP)用于从Web服务器请求页面并将它们从Web服务器发送回浏览器。 |
2 | https:// 安全超文本传输协议(HTTPS)使用数字证书加密浏览器和Web服务器之间发送的数据。 |
3 | ftp:// 文件传输协议是另一种在Web上传输文件的方法。 虽然由于与浏览器的集成,HTTP在查看网站时更受欢迎,但FTP仍然是常用的协议,用于在Web上传输大型文件并将源文件上传到Web服务器。 |
4 | file:// 用于指示文件位于本地硬盘或LAN上的共享目录中。 |
主机地址
主机地址是可以找到网站的地方,IP地址(0到255之间的四组数字,例如68.178.157.132),或者更常见的是诸如www.xnip.cn之类的站点的域名。 请注意,“www”实际上并不是域名的一部分,尽管它通常用在主机地址中。
文件路径
文件路径始终以正斜杠字符开头,可能包含一个或多个目录或文件夹名称。 每个目录名称由正斜杠字符分隔,文件路径可能以末尾的文件名结尾。 这里index.htm是html目录中可用的文件名:
https://www.xnip.cn<span style="color:green">/html/index.htm</span>
URL的其他部分
使用凭据是一种为站点的受密码保护的部分指定用户名和密码的方法。 凭证位于主机地址之前,它们通过@符号与主机地址分开。 请注意如何通过冒号将用户名与密码分开。 以下URL显示用户名admin和密码admin123 :
https://admin:admin123@xnip.cn/admin/index.htm
使用上述URL,您可以对管理员进行身份验证,如果提供的ID和密码正确,则管理员可以访问admin目录中的index.htm文件。
您可以使用telnet URL连接到服务器,如下所示:
telnet://user:password@xnip.cn:port/
另一个重要信息是Web服务器Port Number 。 默认情况下,HTTP Server在端口号80上运行。但是,如果您在任何其他端口号上运行服务器,则可以按如下方式提供,假设服务器在端口8080上运行:
https://www.xnip.cn:8080/index.htm
Fragment identifiers可以在文件名后使用,以指示浏览器应立即进入的页面的特定部分。 以下是访问页面顶部html_text_links.htm的示例。
https://www.xnip.cn/html/html_text_links.htm#top
您可以使用URL将一些信息传递给服务器。 当您在网页上使用表单(例如搜索表单或在线订单表单)时,浏览器可以将您提供的信息附加到URL,以便将信息从浏览器传递到服务器,如下所示 -
https://www.xnip.cn/cgi-bin/search.cgi?searchTerm=HTML
这里, searchTerm=HTML被传递到服务器,其中search.cgi脚本用于解析此传递的信息并采取进一步的操作。
绝对和相对URL
您可以通过以下两种方式之一来处理URL:
Absolute - 绝对URL是资源的完整地址。 例如https://www.xnip.cn/html/html_text_links.htm
Relative - 相对URL指示资源相对于当前页面的位置。 给定URL添加“base”元素以形成完整的URL。 例如/html/html_text_links.htm
保留和不安全的字符
保留字符是URL中具有特定含义的字符。 例如,斜杠字符分隔URL中路径名的元素。 如果您需要在不打算作为元素分隔符的URL中包含斜杠,则需要将其编码为%2F:
不安全的字符是URL中没有特殊含义的字符,但在写入URL的上下文中可能具有特殊含义。 例如,双引号(“”)分隔标记中的URL属性值。 如果您需要在URL中直接包含双引号,则可能会混淆浏览器。 相反,您应该编码双引号以避免任何可能的冲突。
您可以查看HTML URL Encoding教程以了解此编码,保留和不安全的字符。