九、HTTP

作者: SeanLink | 来源:发表于2023-10-23 13:57 被阅读0次

HTTP(九.HTTP追加功能协议)
【前端 · 面试】HTTP 总结（九）—— HTTP 协商缓存
5
网络协议底层原理（九）：HTTP
Python
Codefine区块链技术早餐(2019-02-20)
九型人格介绍
Android开发应该知道的签名知识！
图解HTTP(3)
Http协议的各种请求方法解析

HTTP

HTTP （Hyper Text Transfer Protocol），译为超文本传输协议
设计HTTP最初的目的是：提供一种发布和接收HTML页面的方法，由URI来标识具体的资源
后面用HTTP来传递的数据格式不仅仅是HTML，应用非常广泛
HTML（ Hyper Text Markup Language）：超文本标记语言
用以编写网页

版本

1991年，HTTP/0.9
只支持GET请求方法获取文本数据（比如HTML文档），且不支持请求头、响应头等，无法向服务器传递太多信息
1996年，HTTP/1.0
支持POST、HEAD等请求方法，支持请求头、响应头等，支持更多种数据类型（不再局限于文本数据）
浏览器的每次请求都需要与服务器建立一个TCP连接，请求处理完成后立即断开TCP连接
1997年，HTTP/1.1（最经典、使用最广泛的版本）
支持PUT、DELETE等请求方法
采用持久连接（Connection: keep-alive），多个请求可以共用同一个TCP连接
2015年，HTTP/2.0
2018年，HTTP/3.0

标准

HTTP的标准
由万维网协会（W3C）、互联网工程任务组（IETF）协调制定，最终发布了一系列的RFC
RFC（Request For Comments，可以译为：请求意见稿）
HTTP/1.1最早是在1997年的RFC 2068中记录的
该规范在1999年的RFC 2616中已作废
2014年又由RFC 7230系列的RFC取代
HTTP/2标准于2015年5月以RFC 7540正式发表，取代HTTP/1.1成为HTTP的实现标准
中国的RFC
1996年3月，清华大学提交的适应不同国家和地区中文编码的汉字统一传输标准被IETF通过为RFC 1922
成为中国大陆第一个被认可为RFC文件的提交协议

报文格式

image.png

ABNF

ABNF (Augmented BNF)
是BNF（Backus-Naur Form，译为：巴科斯-瑙尔范式）的修改、增强版
在RFC 5234中表明：ABNF用作internet中通信协议的定义语言
ABNF是最严谨的HTTP报文格式描述形式，脱离ABNF谈论HTTP报文格式，往往都是片面、不严谨的
关于HTTP报文格式的定义
RFC 2616 4.HTTP Message（旧）
RFC 7230 3.Message Format（新)

ABNF--- 核心规则

image.png

报文格式

HTTP-message = start-line
*( header-field CRLF )
CRLF
[ message-body ]

start-line = request-line / status-line

image.png

request-line 、status-line

request-line = method SP request-target SP HTTP-version CRLF
HTTP-version = HTTP-name "/" DIGIT "." DIGIT
HTTP-name = %x48.54.54.50 ; HTTP
示例:
GET / hello/ HTTP/1.1

status-line = HTTP-version SP status-code SP reason-phrase CRLF
status-code = 3DIGIT
reason-phrase = *( HTAB / SP / VCHAR / obs-text )
示例:
HTTP/1.1 200
HTTP/1.1 200 OK

header-field、message-body

header-field = field-name ":" OWS field-value OWS
field-name = token
field-value = *( field-content / obs-fold )
OWS = *( SP / HTAB )
message-body = *OCTET

URL编码

URL中一旦出现了一些特殊字符（比如中文、空格），需要进行编码
在浏览器地址栏输入URL时，是采用UTF-8进行编码
比如
编码前：https://www.baidu.com/s?wd=百度
编码后：https://www.baidu.com/s?wd=%E5%8D%8E%E4%B8%BA

Xshell + telnet 使用

安装一个Xshell（安全终端模拟软件），在Xshell中使用telnet
可以直接面向HTTP报文与服务器交互
可以更清晰、直观地看到请求报文、响应报文的内容
可以检验请求报文格式的正确与否
image.png
image.png

请求方法

RFC 7231, section 4: Request methods：描述了8种请求方法
GET、HEAD、POST、PUT、DELETE、CONNECT、OPTIONS、TRACE
RFC 5789, section 2: Patch method：描述了PATCH方法
GET：常用于读取的操作，请求参数直接拼接在URL的后面（浏览器对URL是有长度限制的）
POST：常用于添加、修改、删除的操作，请求参数可以放到请求体中（没有大小限制）
HEAD：请求得到与GET请求相同的响应，但没有响应体
使用场景举例：在下载一个大文件前，先获取其大小，再决定是否要下载。以此可以节约带宽资源
OPTIONS：用于获取目的资源所支持的通信选项，比如服务器支持的请求方法
OPTIONS * HTTP/1.1
PUT：用于对已存在的资源进行整体覆盖
PATCH：用于对资源进行部分修改（资源不存在，会创建新的资源）
DELETE：用于删除指定的资源
TRACE：请求服务器回显其收到的请求信息，主要用于HTTP请求的测试或诊断
CONNECT：可以开启一个客户端与所请求资源之间的双向沟通的通道，它可以用来创建隧道（tunnel）
可以用来访问采用了 SSL (HTTPS) 协议的站点

头部字段(Header Field)

头部字段	说明	示例
Range	仅请求某个实体的一部分。字节偏移以开始	Range : bytes = 500-999
Origin	发起一个针对跨域资源共享的请求	Origin:https://www.baidu.com
Cookie	之前由服务器通过 Set-Cookie发送的Cookie	Cookie; $Version = 1; Skin=new
Connection	该浏览器想要优先使用的连接类型	Connection:keep-alive
Cache-Control	用来指定在这次的请求响应链中的所有缓存机制,都必须遵守的指令	Cache-Control: no-cache
Date	发送该消息的日期和时间	Date:Fri, 09 Dec 2022 09:24:35 GMT
Last-Modified	所请求的对象的最后修改日期	Last-Modified: Fri, 09 Dec 2022 09:24:35 GMT
Server	服务器的名字	BWS/1.1
Expires	指定一个时间，超过该时间则认为此响应已经过期期	Expires:Fri, 09 Dec 2022 04:14:22 GMT
Content-Type	响应体的类型	Content-Type:text/javascript; charset=utf-8
Content-Encoding	内容锁使用的编码类型	Content-Encoding:br
Content-Length	响应体的长度（字节为单位)	Content-Length:348
Content-Disposition	一个可以让客户端下载文件并建议文件名的头部	Content-Disposition :attachment;filename="fname.ext"
Accept-Rangs	发起一个针对跨域资源共享的请求	Accept-Rangs:bytes
Content - Range	这条部分消息是属于完整消息的哪部分	Content - Range: bytes 21010-47021/47022
Acces-Control-Allow-Origin	指定哪些网站可参与到跨来源资源共
享过程中	Acces-Control-Allow-Origin: *
Location	用来进行重定向，或者在创建了某个新资源时使用	Location:http://www.w3.org
Set-Cookie	返回一个Cookie让客户端去保存	Set-Cookie:BDRCVFR[S4-dAuiWMmn]=qCznQ2sbsFTfj0znj01n1bsg1NxpA7E; path=/; domain=.baidu.com
Connection	针对该连接所预期的选项	Connection : close
Cache-Control	向从服务器直到客户端在内的所有缓存机制告知，它们是否可以缓存这个对象。单位为秒	Cache-Control: max-age=3600

状态码

在RFC 2616 10.Status Code Definitions规范中定义
状态码指示HTTP请求是否已成功完成
状态码可以分为5类
信息响应：100~199
成功响应：200~299
重定向：300~399
客户端错误：400~499
服务器错误：500~599

常见状态码

100 Continue
请求的初始部分已经被服务器收到，并且没有被服务器拒绝。客户端应该继续发送剩余的请求，如果请求已经完
成，就忽略这个响应
允许客户端发送带请求体的请求前，判断服务器是否愿意接收请求（服务器通过请求头判断）
在某些情况下，如果服务器在不看请求体就拒绝请求时，客户端就发送请求体是不恰当的或低效的
200 OK：请求成功
302 Found：请求的资源被暂时的移动到了由Location头部指定的URL上
304 Not Modified：说明无需再次传输请求的内容，也就是说可以使用缓存的内容
400 Bad Request：由于语法无效，服务器无法理解该请求
401 Unauthorized：由于缺乏目标资源要求的身份验证凭证
403 Forbidden：服务器端有能力处理该请求，但是拒绝授权访问
404 Not Found：服务器端无法找到所请求的资源
405 Method Not Allowed：服务器禁止了使用当前HTTP方法的请求
406 Not Acceptable：服务器端无法提供与Accept-Charset以及Accept-Language指定的值相匹配的响应
408 Request Timeout：服务器想要将没有在使用的连接关闭
一些服务器会在空闲连接上发送此信息，即便是在客户端没有发送任何请求的情况下
500 Internal Server Error：所请求的服务器遇到意外的情况并阻止其执行请求
501 Not Implemented：请求的方法不被服务器支持，因此无法被处理
服务器必须支持的方法（即不会返回这个状态码的方法）只有 GET 和 HEAD
502 Bad Gateway：作为网关或代理角色的服务器，从上游服务器（如tomcat）中接收到的响应是无效的
503 Service Unavailable：服务器尚未处于可以接受请求的状态
通常造成这种情况的原因是由于服务器停机维护或者已超载

form提交 - 常用属性

action：请求的URI
method：请求方法（GET、POST）
enctype：POST请求时，请求体的编码方式
application/x-www-form-urlencoded（默认值）
用&分隔参数，用=分隔键和值，字符用URL编码方式进行编码
multipart/form-data
文件上传时必须使用这种编码方式

multipart/form-data

参考RFC 1521
请求头
Content-Type: multipart/form-data; boundary=xxx

image.png

代理服务器(Proxy Server)

特点
本身不生产内容
处于中间位置转发上下游的请求和响应

面对下游的客户端:他是服务器
面对上游的服务器: 他是客户端

image.png

正向代理、反向代理

正向代理: 代理的对象是客户端
反向代理: 代理的对象是服务器

image.png

正向代理---作用

隐藏客户端身份
绕过防火墙（突破访问限制）
Internet访问控制
数据过滤
......

image.png

反向代理---作用

隐藏服务器身份
安全防护
负载均衡

image.png

抓包工具的原理

Fiddler、Charles等抓包工具的原理：在客户端启动了正向代理服务

image.png
需要注意的是
Wireshark的原理是：通过底层驱动，拦截网卡上流过的数据

代理服务器 --- 相关头部字段

Via：追加经过的每一台代理服务器的主机名（或域名）
X-Forwarded-For：追加请求方的IP地址
X-Real-IP：客户端的真实IP地址

image.png
①
X-Forwarded-For: 14.14.14.14
X-Real-IP: 14.14.14.14
Via: proxy1
②
X-Forwarded-For: 14.14.14.14, 220.11.11.11
X-Real-IP: 14.14.14.14
Via: proxy1, proxy2
③
Via: proxy2
④
Via: proxy2, proxy1

CDN

CDN（Content Delivery Network或Content Distribution Network），译为：内容分发网络
利用最靠近每位用户的服务器
更快更可靠地将音乐、图片、视频等资源文件（一般是静态资源）传递给用户

image.png

CDN使用前后对比

image.png

CDN运营商在全国、乃至全球的各个大枢纽城市都建立了机房
部署了大量拥有高存储高带宽的节点，构建了一个跨运营商、跨地域的专用网络
内容所有者向CDN运营商支付费用，CDN将其内容交付给最终用户

CDN使用前

image.png

CDN使用后

image.png

缓存(Cache)

image.png

实际上，HTTP的缓存机制远远比上图的流程要复杂
通常会缓存的情况是：GET请求 + 静态资源（比如HTML、CSS、JS、图片等）
Ctrl + F5：可以强制刷新缓存

缓存--- 响应头

Pragma：作用类似于Cache-Control，HTTP/1.0的产物
Expires：缓存的过期时间（GMT格式时间），HTTP/1.0的产物
Cache-Control：设置缓存策略
no-storage：不缓存数据到本地
public：允许用户、代理服务器缓存数据到本地
private：只允许用户缓存数据到本地
max-age：缓存的有效时间（多长时间不过期），单位秒
no-cache：每次需要发请求给服务器询问缓存是否有变化，再来决定如何使用缓存
优先级：Pragma > Cache-Control > Expires
Last-Modified：资源的最后一次修改时间
ETag：资源的唯一标识（根据文件内容计算出来的摘要值）
优先级：ETag > Last-Modified

缓存--- 请求头

If-None-Match
如果上一次的响应头中有ETag，就会将ETag的值作为请求头的值
如果服务器发现资源的最新摘要值跟If-None-Match不匹配，就会返回新的资源（200 OK）
否则，就不会返回资源的具体数据（304 Not Modified）
If-Modified-Since
如果上一次的响应头中没有ETag，有Last-Modified，就会将Last-Modified的值作为请求头的值
如果服务器发现资源的最后一次修改时间晚于If-Modified-Since，就会返回新的资源（200 OK）
否则，就不会返回资源的具体数据（304 Not Modified）

Last-Modified vs ETag

Last-Modified的缺陷
只能精确到秒级别，如果资源在1秒内被修改了，客户端将无法获取最新的资源数据
如果某些资源被修改了（最后一次修改时间发生了变化），但是内容并没有任何变化
会导致相同数据重复传输，没有使用到缓存
ETag可以办到
只要资源的内容没有变化，就不会重复传输资源数据
只要资源的内容发生了变化，就会返回最新的资源数据给客户端

缓存流程图

image.png

HTTP(九.HTTP追加功能协议)
1.HTTP的瓶颈在 Facebook 和 Twitter 等 SNS 网站上，几乎能够实时观察到海量用户公开发...
【前端 · 面试】HTTP 总结（九）—— HTTP 协商缓存
最近我在做前端面试题总结系列，感兴趣的朋友可以添加关注，欢迎指正、交流。争取每个知识点能够多总结一些，至少要做到在...
5
http://ynm35.zhikoko.com/ss落花梦歌九通娱乐http://ynm41.zhikoko....
网络协议底层原理（九）：HTTP
一、HTTP协议是什么？ HTTP(Hyper Text Transfer Protocol)译为超文本传输协议，...
Python
Python自动化测试（九）urllib2 发送HTTP Request ...
Codefine区块链技术早餐(2019-02-20)
1. ZepKit入门 http://t.cn/EVSRpWZ 2. 以太坊上发送交易的九种办法: http://...
九型人格介绍
️九型人格大纲心区： 2号的九个层级简介：http:// tieba.baidu.com/p/24637813...
Android开发应该知道的签名知识！
作者：九心转载地址：https://juejin.cn/post/7111116047960244254[http...
图解HTTP(3)
第九章基于HTTP的功能追加协议 1. 消除HTTP瓶颈的SPDY(Google 2010),解决性能瓶颈,缩短...
Http协议的各种请求方法解析
标准Http协议支持九种请求方法，即： HTTP1.0 定义了三种请求方法： GET, POST 和 HEAD方法...

九、HTTP

HTTP

版本

标准

报文格式

ABNF

ABNF--- 核心规则

报文格式

start-line = request-line / status-line

request-line 、status-line

header-field、message-body

URL编码

Xshell + telnet 使用

请求方法

头部字段(Header Field)

状态码

常见状态码

form提交 - 常用属性

multipart/form-data

代理服务器(Proxy Server)

正向代理、反向代理

正向代理---作用

反向代理---作用

抓包工具的原理

代理服务器 --- 相关头部字段

CDN

CDN使用前后对比

CDN使用前

CDN使用后

缓存(Cache)

缓存--- 响应头

缓存--- 请求头

Last-Modified vs ETag

缓存流程图

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读