HTTP是基于TCP/IP协议的应用层协议。它不涉及数据包传输,主要规定了客户端和服务端之间的通信格式,默认使用80端口。

最早版本是1991年发布的0.9版。该版本极其简单,只有一个命令 GET.
GET /index.html
上面的命令表示:TCP连接建立之后,客户端向服务端请求(request)网页 index.html
协议规定,服务器只能回应HTML格式的字符串,不能回应别的格式。

服务器发送完毕,就关闭TCP连接。
HTTP/1.0
1996年发布的。
任何格式的内容都可以发送。这使得互联网不仅可以传输文字,还能传输图像,视频,二进制文件。
除了GET命令,还引入了 POST 命令和 HEAD 命令。
HTTP请求和回应的格式也变了。除了数据部分,每次通信都必须包括头信息,用来描述一些元数据。
Content-Type字段
关于字符的编码,1.0版规定,头信息必须是ASCII码,后面的数据可以是任何格式。服务器回应的时候,必须告诉客户端,数据是什么格式,这就是Content-Type字段的作用。
下面是一些常见的Content-Type字段的值:

这些数据的类型总称为 MIME type,每个值包括一级类型和二级类型,之间用斜杠分隔。
Content-Encoding
由于发送的数据可以是任何格式,因此可以把数据压缩后再发送。
Content-Encoding字段说明数据的压缩方法。

客户端在请求时,用 Accept-Encoding字段说明自己可以接受哪些压缩方法。

HTTP/1.0版本的主要缺点是,每个TCP连接只能发送一个请求。发送数据完毕,连接就关闭,如果还要请求其他资源,就必须再新建一个连接。
TCP 连接的新建成本很高,因为需要客户端和服务端三次握手,并且开始时发送速率较慢。
为了解决这个问题,有些浏览器在请求时,用了一个非标准的 Connection字段。
Connection:keep-alive
这个字段要求服务器不要关闭TCP连接,一边其他请求复用。
服务器同样回应这个字段。
Connection:keep-alive
HTTP/1.1
1997年发送的这个版本完善了HTTP协议。
1.1版本最大的变化,就是引入了持久连接(persistent connection),即TCP连接默认不关闭,可以被多个请求复用,不用声明 Connection:keep-alive
客户端和服务端发现对方一段时间没有活动,就可以主动关闭连接。
不过,规范的做法是,客户端在最后一个请求时,发送 Connection: close
明确要求服务器关闭TCP连接。
管道机制
·1.1版还引入了管道机制(pipe lining),即在同一个TCP连接里面,客户端可以同时发送多个请求。
以前的做法是,在同一个TCP连接里面,先发送A请求,然后等待服务器做出回应,收到后再发出B请求。管道机制则是先允许浏览器同时发送A请求和B请求,但是服务器还是按照顺序,先回应A请求,完成后再回应B请求。
Content-Length字段
一个TCP连接现在可以传送多个回应,势必就要有一种机制,区分数据包是属于哪一个回应的。这就是Content-length字段的作用,声明本次回应的数据长度。

上面的字段告诉浏览器,本次回应的长度是3495个字节。
分块传输编码
使用Content-Length字段的前提条件是,服务器发送之前,必须知道回应的数据长度。
对于一些很耗时的动态操作来说,这意味着,服务器要等到所有操作完成,测i能发送数据,显然这样的效率不高。更好的处理方法是,产生一块数据,就发送一块,采用 流模式 取代 缓存模式。
因此,1.1版本可以不适用Content-Length字段,而使用“分块传输编码”。只要请求或回应的头信息有 Transfer-Encoding字段,就表明回应将由数量未定的数据块组成。

HTTP/1.1还新增了许多动词方法:PUT, PATCH, HEAD,OPTIONS, DELETE。
Host字段用来指定服务器的域名。
Host: www.google.com
HTTP/2
2015年,HTTP/2发布。
HTTP/1.1版的头信息肯定是文本(ASCII编码),数据体可以是文本,也可以是二进制。
HTTP/2则是一个彻底的二进制文本协议,头信息和数据体都是二进制,并且统称为帧(frame):头信息帧和数据帧。
HTTP/2复用TCP连接,在一个连接中,客户端和浏览器都可以同时发送多个请求或回应,而且不用按照顺序一一对应。
举例来说,在一个TCP连接里面,服务器同时收到了A请求和B请求,于是先回应A请求,结果发现处理过程非常耗时,于是就发送A请求已经处理好的部分,接着回应B请求,完成后,再发送A请求剩下的部分。
因为HTTP/2的数据包是不按照顺序发送的,同一个连接里面连续的数据包,可能属于不同的回应。因此,必须要对数据包做标记,指出它属于哪个回应。
HTTP/2将每个请求或回应的所有数据包,称为一个数据流。每个数据流都有一个独一无二的编号。数据包发送的时候,都必须标记数据流ID,用来区分它属于哪个数据流。
客户端发出的数据流,ID一律为奇数;
服务器发出的,ID为偶数。
HTTP/2允许服务器未经请求,主动向客户端发送资源,这叫做服务器推送。(Server push)
常见场景是客户端请求一个网页,这个网页里面包含很多静态资源。在正常情况下,客户端必须收到网页后,解析HTML源码,发现有静态资源,再发出静态资源请求。
网友评论