我们平常浏览网页时,一般会先在浏览器地址栏输入URL,之后经过短暂的等待就能看到web页面了。流程如下:
网页访问示例Demo
Web页面肯定不会是凭空出来的,它是根据我们在地址栏内输入的URL,从服务器获取到信息,再显示到Web页面。
Web使用HTTP协议作为规范,完成从用户的客户端到服务器端的一系列流程。可以说Web是建立在Http协议基础上的。那么HTTP协议是什么呢?
HTTP是什么
HTTP(HyperText Transfer Protocol 超文本传输协议)
是一套计算机通过网络进行通信的规则。HTTP协议使得HTTP客户端(如Web浏览器)能够从HTTP服务器(Web服务器)请求信息和服务,HTTP目前协议的版本是1.1,RPC关于http的描述。HTTP是一种无状态的协议,无状态是指Web浏览器和Web服务器之间不需要建立持久的连接,这意味着当一个客户端向服务器端发出请求,然后Web服务器返回响应(response),连接就被关闭了,在服务器端不保留连接的有关信息.HTTP遵循请求(Request)/应答(Response)模型。Web浏览器向Web服务器发送请求,Web服务器处理请求并返回适当的应答。所有HTTP连接都被构造成一套请求和应答。
HTTP请求之Request
客户端发送一个HTTP请求到服务器的请求消息包括以下格式:
请求行(request line)、请求头部(header)、空行和请求数据四个部分组成。
我们尝试访问TusCloud,看一下具体的请求。
浏览器地址栏内输入https://tuscloud.net或直接点击上面的TusCloud超链接。在Chrome浏览器下,打开console查看Network
,可以明确的看到以下信息。
*general*
Request URL: https://tuscloud.net/
Request Method: GET
Status Code: 200 OK
Remote Address: 47.94.57.117:443
Referrer Policy: no-referrer-when-downgrade
*request headers*
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9
Cache-Control: max-age=0
Connection: keep-alive
Cookie: _icl_current_language=zh-hans
Host: tuscloud.net
If-Modified-Since: Thu, 01 Jan 1970 00:00:00 GMT
If-None-Match: "7b042b98ed8197bc245a6131065788bb"
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36
- 请求行
Request URL: https://tuscloud.net/
Request Method: GET
以GET方式访问URL地址为https://tuscloud.net/的资源
注意:请求方法(所有方法全为大写)有多种,各个方法的解释如下
HTTP1.0定义了三种请求方法: GET, POST 和 HEAD方法。
HTTP1.1新增了五种请求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。
GET 请求指定的页面信息,并返回实体主体。
HEAD 类似于get请求,只不过返回的响应中没有具体的内容,用于获取报头
POST 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。
POST请求可能会导致新的资源的建立和/或已有资源的修改。
PUT 从客户端向服务器传送的数据取代指定的文档的内容。
DELETE 请求服务器删除指定的页面。
CONNECT HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。
OPTIONS 允许客户端查看服务器的性能。
TRACE 回显服务器收到的请求,主要用于测试或诊断。
-
请求头部
经常用到的参数说明
HOST将指出请求的目的地,表示请求的域名是https://tuscloud.net.如果一台服务器有多个网站,服务器就需要通过Host来区分浏览器请求的是哪个网站.
User-Agent会告诉网站服务器,访问者是通过什么工具来请求的.该信息由你的浏览器来定义,并且在每个请求中自动发送等等.
Content-Type请求体的MIME类型 (用于POST和PUT请求中) 示例:application/x-www-form-urlencoded
Content-Length以8进制表示的请求体的长度 -
请求数据也叫主体,可以添加任意的其他数据。
这个示例中的请求数据为空。不过可以点击其他页面。例如
https://tuscloud.net/wp-includes/js/wp-emoji-release.min.js?ver=4.9
ver: 4.9
上面代码框内的数据及请求数据。
HTTP之响应消息Response
HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文。
示例:
HTTP/1.1 200 OK
Date: Sat, 08 Dec 2018 08:39:42 GMT
Content-Type: text/html; charset=UTF-8
<html>
<head></head>
<body>
<!--body goes here-->
</body>
</html>
- 状态行,由HTTP协议版本号, 状态码, 状态消息 三部分组成。
第一行为状态行,(HTTP/1.1)表明HTTP版本为1.1版本,状态码为200,状态消息为(ok) - 消息报头,用来说明客户端要使用的一些附加信息
第二行和第三行为消息报头,
Date:生成响应的日期和时间;Content-Type:指定了MIME类型的HTML(text/html),编码类型是UTF-8 - 空行,消息报头后面的空行是必须的
- 响应正文,服务器返回给客户端的文本信息。
空行后面的html部分为响应正文。
单次的Http详细过程如下:
单次HTTP请求的各个阶段
在图例中可以看到Http协议是一个应用层的协议,基于传输层的TCP协议及网络层的IP协议。
HTTP之状态码
状态代码有三位数字组成,第一个数字定义了响应的类别,共分五种类别:
1xx:指示信息--表示请求已接收,继续处理
2xx:成功--表示请求已被成功接收、理解、接受
3xx:重定向--要完成请求必须进行更进一步的操作
4xx:客户端错误--请求有语法错误或请求无法实现
5xx:服务器端错误--服务器未能实现合法的请求
常见状态码:
200 OK //客户端请求成功
400 Bad Request //客户端请求有语法错误,不能被服务器所理解
401 Unauthorized //请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
403 Forbidden //服务器收到请求,但是拒绝提供服务
404 Not Found //请求资源不存在,eg:输入了错误的URL
500 Internal Server Error //服务器发生不可预期的错误
503 Server Unavailable //服务器当前不能处理客户端的请求,一段时间后可能恢复正常
附录一:其他详细状态码参见rfc2616
附录二:其他的参数参见文档常用的HTTP请求头与响应头
网友评论