超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网中使用最为广泛的一种网络协议。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。
HTTP是一个客户端和服务器端请求和应答的标准(TCP)。客户端是终端用户,服务器端是网站。通过使用Web浏览器、网络爬虫或者其它的工具,客户端发起一个到服务器上指定端口(默认端口为80)的HTTP请求。(我们称这个客户端)叫用户代理(user agent)。应答的服务器上存储着(一些)资源,比如HTML文件和图像。(我们称)这个应答服务器为源服务器(origin server)。在用户代理和源服务器中间可能存在多个中间层,比如代理,网关,或者隧道(tunnels)。尽管TCP/IP协议是互联网上最流行的应用,HTTP协议并没有规定必须使用它和(基于)它支持的层。 事实上,HTTP可以在任何其他互联网协议上,或者在其他网络上实现。HTTP只假定(其下层协议提供)可靠的传输,任何能够提供这种保证的协议都可以被其使用。
通常,由HTTP客户端发起一个请求,建立一个到服务器指定端口(默认是80端口)的TCP连接。HTTP服务器则在那个端口监听客户端发送过来的请求。一旦收到请求,服务器(向客户端)发回一个状态行,比如"HTTP/1.1 200 OK",和(响应的)消息,消息的消息体可能是请求的文件、错误消息、或者其它一些信息。
HTTP使用TCP而不是UDP的原因在于(打开)一个网页必须传送很多数据,而TCP协议提供传输控制,按顺序组织数据,和错误纠正。
通过HTTP或者HTTPS协议请求的资源由统一资源标示符(Uniform Resource Identifiers)(或者,更准确一些,URLs)来标识。所以认识Http协议,得从URL开始。(HTTP 协议中 URI 和 URL 有什么区别?)
URL
eg:https://www.jianshu.com/u/f499dc93facb(我的简书地址,会定期更新一些技术博客,欢迎关注。),这就是一个URL。
http : 表示这个请求是遵守http协议。其实还有很多其他的协议,eg:https,ftp....
www.cnblogs.com :是服务器的域名。一些个URL没有域名直接就是IP地址,eg:https://59.108.137.201/u/f499dc93facb 就是把 www.jianshu.com 换成59.108.137.201。其实都一样,到最后都得解析成IP地址,就是一串数字。那IP地址有什么用?用处大了,IP地址可以帮我们找到唯一的服务器,不然全世界那么多服务器,鬼知道要向哪台服务器请求数据。
u/f499dc93facb :就是请求路径,告诉服务器,从哪里请求数据。
HTTP请求
那介绍完URL,就该介绍HTTP协议了。HTTP协议规定,一个完整的由客户端发给服务器的HTTP请求包括请求行,请求头,请求体。
1.请求行:包含了请求方法、请求资源路径、HTTP协议版本;
GET /u/2552663324 HTTP/1.1
2.请求头:包含了对客户端的环境描述、客户端请求的主机地址等信息
(1)客户端想访问的主机地址
Host:218.30.115.123
(2)客户端的类型,客户端的软件环境
User-Agent:Mozilla/5.0 (Macintosh; Intel Mac OS X 10.11; rv:48.0) Gecko/20100101 Firefox/48.0
(3)客户端所能接收的数据类型
Accept:text/html ,/
(4)客户端的语言环境
Accept-Language:zh-cn
(5)客户端支持的数据压缩格式
Accept-Encoding:gzip
3.请求体:POST请求才有,GET没有。是客户端发给服务器的具体数据,比如文件数据。
HTTP请求响应
客户端向服务器发送请求,服务器应当做出响应,及返回数据给客户端。HTTP协议规定:1个完整的HTTP响应中包换以下内容:状态行,响应头,实体内容,和HTTP请求相对。
1.状态行:包含了HTTP协议版本、状态码、状态英文名称。
(1)HTTP/1.1 200 OK
2.响应头:包含了对服务器的描述、对返回数据的描述。
(1)服务器的类型
Server:Apache-Coyote/1.1
(2)返回数据的类型
Content-Type:text/html;charset=UTF-8
(3)返回数据的长度
Content-Length:3012
(4)响应的时间
Date:Wed, 28 Sep 2016 06:38:08 GMT
3.实体内容:服务器返回给客户端的具体数据,比如文件数据。
网友评论