1. 前言
最近打算学习一些网络相关的知识,经别人推荐,说《图解HTTP》这本书不错,于是便买来打算学习一波。笔记之中有什么错误,还望指出_。
一般的网络协议相关的书籍,仅仅是其厚度就令人望而生畏;但这本书仅仅有二百五十多页,让人不那么抵触,而且内容图文并茂,也不是那么枯燥,让人有种想看下去的欲望。
好了,废话不多说了,在学习HTTP之前,先了解了一下HTTP的发展历史和一些网络基础。
2. HTTP,一个发育缓慢的孩子
2.1 什么是 HTTP ?
我们使用HTTP最多的时候,就是我们在浏览网页的时候。
当你在浏览器的地址栏中输入网址后,一回车就会呈现出你要搜寻的页面,那么这个过程是如何实现的呢?
其实是我们的浏览器会根据你输入的网址,去对应的服务器端获取到相应的资源,然后在将它显示出来。那么在这个过程中,肯定要遵守一个规则,这个规则就是HTTP协议。
HTTP(HyperText Transfer Protocol),中文名字叫“超文本传输协议”。HTTP诞生于1990年,由CERN(欧洲核子研究组织)提出,目的是为解决文档传输难题,让远隔两地的研究者实现知识共享。
2.2 Web技术飞速发展
1990年11月,CERN 研发出第一台Web服务器和Web浏览器;
1993年,HTML1.0在全世界范围流行;
1994年,网景通信公司发布了浏览器 Netscape Navigator 1.0;
1995年,微软公司发布了浏览器 Internet Explorer 1.0 和 2.0,浏览器大战一触即发;
随后 Web服务器标准之一的 Apache 以 Apache 0.2 的姿态出现在世人面前,HTML 也发布了 2.0 版本。
随着浏览器大战愈演愈烈,浏览器公司不顾Web标准化,屡次新增功能却没有对应的说明文档,而且还对各自的HTML进行了扩展,导致前端工程师开发时,必须考虑兼容他们公司的浏览器。
2000年左右,随着网景通信公司的衰落,浏览器大战也告一段落。但在2004年,Mozilla基金会发布了 Firefox(火狐)浏览器,浏览器大战再次爆发。
Chrome、Opera、Safari 等浏览器也纷纷抢占市场。
2.3 驻足不前的HTTP
1990年 HTTP 问世,但那时没有作为正式的标准,所以称之为 HTTP/0.9;
1996年5月,HTTP 正式作为标准版公布,命名为 HTTP/1.0,该协议至今仍在广泛使用在服务端。
1997年1月发布 HTTP/1.1,这是目前主流的HTTP协议版本。
现在 HTTP/2.0 正在制定中,但要达到较高的使用覆盖率,恐怕还需要一段时间。
3. 网络基础 TCP/IP 协议族
现在通常使用的网络都是在 TCP/IP 协议族的基础上运作的,HTTP协议就属于它内部的一个子集。
计算机要和网络设备实现通信,双方就必须基于同样的方法,遵守各种协议,这样把互联网相关的协议集合起来,总称为 TCP/IP。
3.1 TCP/IP 的分层管理
为了能方便的修改和扩展,TCP/IP 采用分层的设计方式,这样当某个地方需要修改时,不需要更改整个协议,只需要修改相应的层即可。
TCP/IP 协议族分为四层:应用层,传输层,网络层,链路层。
3.1.1 应用层
应用层决定了向用户提供服务时通信的活动,比如HTTP,FTP(文件传输协议),DNS(域名系统)等。
3.1.2 传输层
传输层对上层应用层,提供处于网络连接中的两台计算机之间的数据传输。在这层有两个性质不同的协议:TCP(传输控制协议),UDP(用户数据报协议)。
3.1.3 网络层
又名网络互连层。该层用来处理网络上流动的数据包,规定通过怎样的路径把数据包传递给对方。IP协议等位于这一层。
3.1.4 链路层
又名数据链路层,网络接口层。用于处理连接网络的硬件部分。
3.2 TCP/IP 通信传输流

如图1所示,利用 TCP/IP 进行网络通信时,发送端从应用层往下走,而接收端从链路层往上走。

如图2所示,发送端在传递数据时,每经过一层,就会被打上一个包含该层所属的首部信息;接收端在传递数据时,每经过一层,就会把对应的首部信息去掉。
4. 与 HTTP 密切相关的三个协议
在 TCP/IP 协议族中,有三个和 HTTP 密不可分的协议,它们分别是 DNS服务、TCP协议 和 IP协议。
4.1 负责域名解析的 DNS服务
DNS服务 和 HTTP协议 都位于应用层。DNS服务提供域名到IP地址的解析服务。
什么是域名?比如 www.baidu.com 就是域名。
什么是IP地址?比如 119.75.218.70。
域名和IP地址都是用来标记计算机的,有了它就可以找到网络上相应的计算机,举个不恰当的例子,好比你的名字就是域名,你的身份证号就是IP地址,当有人想找你的时候,即可以通过你的名字来找你,也可以通过你的身份证号来找你。
那么为什么会有两个东西来标记计算机呢? 因为一个是给人看的,一个是为计算机看的。与IP地址的一组纯数字对比,用字母配合数字的表示形式更符合人类的记忆习惯;但计算机就不擅长处理字母了,它更擅长处理数字。
为了方便人们记忆,DNS服务应运而生,它提供通过域名查找IP地址,或逆向从IP地址反查域名的服务。

4.2 确保可靠性的 TCP协议
TCP协议位于传输层,提供可靠的字节流服务。
字节流服务是指,为了方便传输,将 大块数据 分割成以 报文段 为单位的 数据包 进行管理。
为了能够确保数据到达目标,TCP协议采用了 三次握手策略。

如图4所示,握手过程中使用了TCP的标志:SYN(同步) 和 ACK(确认)。
第一次握手:发送端先发送一个带有SYN标志的数据包给对方。
第二次握手:接收端收到后回传一个带有SYN/ACK标志的数据包以表示已经收到信息。
第三次握手:发送端再回传一个带ACK标志的数据包,表示握手结束。
如果在握手过程中的任何一个阶段中断,发送端会再次以相同的顺序发送数据包。
举个不恰当的例子,古时候有甲、乙、丙三个国家打仗,这时候甲想联合乙,一起攻打丙。
一:但甲不知道乙愿不愿意,那时候没有微信,扫个码加个好友就能聊天,所以只能靠飞鸽传书。于是甲就写了封信给乙。但甲不知道乙有没有收到信,也不敢去贸然攻打丙,就等着乙的回信。
二:这时候乙收到了信,他也想和甲一起攻打丙,于是乙也写了封信给甲,告诉他我收到你的信了,同意去攻打丙。但这时候乙也不敢轻举妄动,他不知道甲有没有收到信,万一甲没收到信,就光我自己上,那就吃亏了,所以乙也等着甲的回信。
三:甲终于等到了乙的回信,既然同意一起攻打丙了,那么咱们就定个日子,什么时候去打丙吧,于是甲又给乙写了封信。
乙收到了甲的信,日子都定下了,咱们就一起干吧。于是甲和乙这次敢出兵攻打丙。
如果有一方没有收到回信,肯定会再从头来一遍。
4.3 负责传输的 IP协议
IP协议位于网络层,它的作用是把各种数据包传递给对方。为了能传递到对方,就必须满足各类条件,其中最重要的两个是 IP地址 和 MAC地址。
IP地址指明了节点被分配到的地址,MAC地址指网卡所属的固定地址。IP地址可以变换,但MAC地址基本上不会改变。
一般发送数据包不会直接发送的对方那里,而是经过多台计算机和网络设备中转,才能发送带对方那里。在中转时,会利用下一站中转设备的 MAC地址 来搜寻下一个中转目标。这里会采用 ARP协议,一种以解析地址的协议,可以根据通信方的IP地址就可以反查出对应的MAC地址。
利用 IP协议 传输数据包,就好比是快递公司送货一样,一般都会从一个转运中心到另一个转运中心,直到可以送到你手中为止。

4.4 利用HTTP协议、IP协议、TCP协议和DNS服务来请求一个网页的过程图解
通过下面这个图来了解一下在通信过程中,这些协议都发挥了哪些作用。

5. URI 和 URL
5.1 URI 和 URL 简介
URI(Uniform Resource Identifier,统一资源标识符),用字符串标识某一互联网资源。
URL(Uniform Resource Locator,统一资源定位符),表示互联网上资源所处的位置。
可见,URL 是 URI 的子集。

如图7所示,列举了几种 URI 例子
5.2 URI 格式

5.2.1 协议名称
指访问资源时使用哪种协议类型。
5.2.2 登录信息认证
此为可选项,指定用户名和密码作为从服务器获取资源的必要登录信息。
5.2.3 服务器地址
必须指定,地址可以是域名,也可以是IP地址。
5.2.4 服务器端口号
可选项,指定服务器网络连接的端口号,不指定使用默认的端口号。
5.2.5 带层次的文件路径
指定服务器上资源的文件路径位置。
5.2.6 查询字符串
可选项,针对已指定的文件路径内的资源,可以使用查询字符串传入任意参数。
5.2.7 片段标识符
可选项,可以标记出已获取资源中的子资源。
6. 结语
好了,今天大概了解了一下 HTTP 的历史,以及一些网络基础。如果有什么不正确的地方,还请多多指教。
今天就先到这里吧。以后什么时候再见还不一定,因为有时候懒癌发作了很难好过来
网友评论