-
HTTP (Hyper Text Transfer Protocol),译为超文本传输协议
1.是互联网中应用最广泛的应用层协议之一
2.设计HTTP最初的目的是:提供一种发布和接收HTML页面的方法,由URI来标识具体的资源
3.后面用HTTP来传递的数据格式不仅仅是HTML,应用非常广泛 -
HTML ( Hyper Text Markup Language) :超文本标记语言
用以编写网页
版本
-
1991年,HTTP/0.9
只支持GET请求方法获取文本数据(比如HTML文档),且不支持请求头、响应头等,无法向服务器传递太多信息 -
1996年,HTTP/1.0
1.支持POST、HEAD等请求方法,支持请求头、响应头等,支持更多种数据类型(不再局限于文本数据)
2.浏览器的每次请求都需要与服务器建立一个TCP连接,请求处理完成后立即断开TCP连接 -
1997年,HTTP/1.1 (最经典、使用最广泛的版本)
1.支持PUT、DELETE等请求方法
2.采用持久连接(Connection: keep-alive),多个请求可以共用同一个TCP连接
3.比如以前请求网页,里面有多个请求,则需要每个请求都和服务器建立连接,传输数据后关闭链接。现在请求一个网页的时候客户端和服务器建立连接后,不关闭,可以多次传输数据,直到发起终止请求。 -
2015年,HTTP/2.0
-
2018年,HTTP/3.0
处于草稿阶段
标准
-
HTTP的标准
万维网协会(W3C)、 互联网工程任务组 (IETF) 协调制定,最终发布了一系列的RFC -
RFC (Request For Comments,可以译为:请求意见稿)
- HTTP/1.1最早是在1997年的RFC 2068中记录的
1、该规范在1999年的RFC 261 6中已作废
2、2014年又由RFC 7230系列的RFC取代 - HTTP/2标准于2015年5月以RFC 7540正式发表,取代HTTP/1.1成为HTTP的实现标准
- HTTP/1.1最早是在1997年的RFC 2068中记录的
-
中国的RFC
1996年3月,清华大学提交的适应不同国家和地区中文编码的汉字统一传输标准被IETF通过为RFC 1922,成为中国大陆第一个被认可为RFC文件的提交协议
长连接、短连接
短连接:两个主机间请求建立连接后,发送完消息立马断开的连接。
长连接:两个主机间请求建立连接后,不会立马断开,会有很多次的通信,直到某个时间双方发送断开连接请求。
报文格式
下面2张图表示的是请求报文和响应报文的大致格式。最严谨的报文格式表示还是要看ABNF。


ABNF
-
ABNF (Augmented BNF)
1、是BNF (Backus-Naur Form,译为:巴科斯-瑙尔范式)的修改、增强版
2、在RFC 5234中表明: ABNF用作internet中通信协议的定义语言
3、ABNF是最严谨的HTTP报文格式描述形式,脱离ABNF谈论HTTP报文格式,往往都是片面、不严谨的
ABNF核心规则

- http-message = start-line + 任意个(header-field + 换行符) + 换行符 + 消息体

-
start-line(开始行)分2种
1、request-line请求行,是请求报文的第一行
2、status-line状态行,是响应报文的第一行

如图所示:请求行=请求方法+空格+请求目标+空格+http版本+换行

如图所示:状态行=http版本+空格+状态码+空格+短语(可省略可多个)+换行
- header-field=名字+冒号+任意个空格+值+任意个空格

- Message-body=任意个字节的数据

URL编码
-
URL中一旦出现了一-些特殊字符(比如中文、空格),需要进行编码
在浏览器地址栏输入URL时,是采用UTF- 8进行编码 -
比如:
编码前: https://www.baidu.com/s?wd=百度
编码后: https://www.baidu.com/s?wd= %E5%8D%8E%E4%B8%BA
请求方法
-
有9大请求方法
GET、HEAD、POST,、PUT,、DELETE、CONNECT、OPTIONS、TRACE、PATCH -
GET:常用于读取的操作,请求参数直接拼接在URL的后面(浏览器对URL是有长度限制的)
-
POST:常用于添加、修改、删除的操作,请求参数可以放到请求体中(没有大小限制)
-
HEAD:请求得到与GET请求相同的响应,但没有响应体
使用场景举例:在下载一 个大文件前,先获取其大小,再决定是否要下载。以此可以节约带宽资源 -
OPTIONS:用于获取目的资源所支持的通信选项,比如服务器支持的请求方法
在响应头里会返回支持的请求方法

-
PUT:用于对已存在的资源进行整体覆盖
不安全基本不用 -
PATCH: 用于对资源进行部分修改(资源不存在,会创建新的资源)
不安全基本不用 -
DELETE:用于删除指定的资源
不安全基本不用 -
TRACE:请求服务器回显其收到的请求信息,主要用于HTTP请求的测试或诊断
让服务器返回它收到的请求信号,用于测试目的。 -
CONNECT:可以开启-一个客户端与所请求资源之间的双向沟通的通道,它可以用来创建隧道(tunnel)
可以用来访问采用了SSL (HTTPS)协议的站点
头部字段(Header Field)
头部字段可以分为4种类型
-
请求头字段(Request Header Fields)
有关要获取的资源或客户端本身信息的消息头 -
响应头字段(Response Header Fields)
有关响应的补充信息,比如服务器本身(名称和版本等)的消息头 -
实体头字段(Entity Header Fields)
响应体就是实体
有关实体主体的更多信息,比如主体长度(Content-Length) 或其MIME类型 -
通用头字段(General Header Fields)
同时适用于请求和响应消息,但与消息主体无关的消息头
请求头字段



-
referer表示该请求之前所在的页面
可以用来做防盗链,比如百度的一张图片,访问该图片时,判断请求头里的referer是否是百度的域名,如果不是就不让访问。 -
Range可以指定请求实体的一部分
1、比如bytes=500-999表示请求实体从第500个字节到第999个字节的数据部分
2、可以用来做多线程断点下载
响应头字段



-
Content-Type表示响应体的类型
Content-Type: text/html; charset=utf-8表示返回的响应体是html文本类型,为utf-8编码格式,展示的就是一个web的样式。Content-Type: text/plain; charset=utf-8表示返回的响应体是普通文本类型,为utf-8编码格式,展示的是一个普通的文本格式。 -
Content-Disposition可以让客户端下载文件并建议文件名
如果没有这个响应头部,客户端访问一个数据的时候会直接展示出来,加了这个头部后,客户端再访问会下载这个文件。
状态码
-
状态码指示HTTP请求是否已成功完成
服务器开发人员可以自己定义状态码返回给客户端,除非遇到某些特定的错误,无法传达到开发人员写的服务端代码那里就直接被系统返回了。 -
状态码可以分为5类
信息响应: 100~199
成功响应: 200~299
重定向: 300~399
客户端错误: 400~499
服务器错误:500~599
常用状态码
-
100 Continue
1、请求的初始部分已经被服务器收到,并且没有被服务器拒绝。客户端应该继续发送剩余的请求,如果请求已经完成,就忽略这个响应
2、允许客户端发送带请求体的请求前,判断服务器是否愿意接收请求(服务器通过请求头判断)
3、在某些情况下,如果服务器在不看请求体就拒绝请求时,客户端就发送请求体是不恰当的或低效的 -
200 OK:请求成功
-
302 Found
1、重定向
2、响应头里会有一个Location头部,值是一个URL。
3、请求的资源被暂时的移动到了由Location头部指定的URL上。
4、比如访问URL:baidu.com会收到状态码302并且响应头里有Location: https://www.baidu.com/ ,随后网页加载的是https://www.baidu.com/ -
304 Not Modified
说明响应的内容无改变,不会返回响应体,客户端使用缓存内容即可 -
400 Bad Request
由于语法无效,服务器无法理解该请求 -
401 Unauthorized
由于缺乏目标资源要求的身份验证凭证 -
403 Forbidden
服务器端有能力处理该请求,但是拒绝授权访问 -
404 Not Found
服务器端无法找到所请求的资源,比如访问的网址不存在 -
405 Method Not Allowed
虽然服务器支持这种请求方式但是禁止使用当前请求方式 -
406 Not Acceptable
服务器端无法提供与Accept-Charset以及Accept-Language指定的值相匹配的响应 -
408 Request Timeout
1、服务器想要将没有在使用的连接关闭
2、http/1.1版本开始请求连接就可以保持长连接,连接后不会立马关闭,可以多次发送数据
3、如果在连接中不通信就是空闲连接,一些服务器会在空闲连接上发送此信息,即便是在客户端没有发送任何请求的情况下 -
500 Internal Server Error
所请求的服务器遇到意外的情况并阻止其执行请求,其实就是服务器端出了问题。 -
501 Not Implemented
1、请求的方法不被服务器支持,因此无法被处理
2、服务器必须支持的方法(即不会返回这个状态码的方法)只有GET和HEAD -
502 Bad Gateway
作为网关或代理角色的服务器,从上游服务器(如tomcat) 中接收到的响应是无效的 -
503 Service Unavailable
1、服务器尚未处于可以接受请求的状态
2、通常造成这种情况的原因是由于服务器停机维护或者已超载
form表单提交
-
action:请求的URI
-
method:请求方法(GET、 POST)
-
enctype: POST请求时,请求体的编码方式
1、application/x-www-form-urlencoded (默认值)
用&分隔参数,用=分隔键和值,字符用URL编码方式进行编码,如:account=jonas&password=12345
2、multipart/form-data
文件上传时必须使用这种编码方式,使用post请求方式
下面我们写一个demo来验证一下这几种方式请求。
- form表单get请求
<form action="/hello/info" method="get" enctype="application/x-www-form-urlencoded">
<div>
姓名
<input type="text" name="name">
</div>
<div>
年龄
<input type="text" name="age">
</div>
<button type="submit">提交</button>
</form>
GET请求抓包数据发现参数是拼接在URI后面的,并且没有请求体。

- form表单post请求
<form action="/hello/info" method="post" enctype="application/x-www-form-urlencoded">
<div>
姓名
<input type="text" name="name">
</div>
<div>
年龄
<input type="text" name="age">
</div>
<button type="submit">提交</button>
</form>
抓包结果发现POST请求比GET请求多了一个请求体,提交的参数是以请求体的形式传递的。

-
form表单post请求 multipart/form-data形式
增加上传一张图片的功能。
<form action="/hello/info" method="post" enctype="multipart/form-data">
<div>
姓名
<input type="text" name="name">
</div>
<div>
年龄
<input type="text" name="age">
</div>
<div>
头像
<input type="file" name="portrait">
</div>
<button type="submit">提交</button>
</form>
可以看到请求头的Content-Type变为了multipart/form-data,并且有一个boundary。两个减号+boundary在请求体里分割了每个参数。

请求体参数最后以两个减号+分隔符+两个减号结尾
这里name和age获取到的参数都为空,因为获取multipart/form-data格式传递的参数和获取application/x-www-form-urlencoded格式的参数方式不一样,需要服务端修改取参方式。

网友评论