美文网首页
HTTP协议

HTTP协议

作者: reef007 | 来源:发表于2018-12-10 16:03 被阅读0次

1. HTTP是什么?

HTTP(超文本传输协议)是一种应用层协议,基于TCP/IP通信协议来传递数据(html文件、图片等等)
HTTP协议用于客户端和服务端之前的通信,通过请求和相应的交互达成通信(协议规定,请求从客户端出发,最后服务器端响应请求并返回数据)。

HTTP是一种无状态协议,即协议自身不对请求和响应之间的通信状态进行保存。

TCP/IP协议族

咱们通常使用的网络是在TCP/IP协议族的基础上运作的,而http属于它内部的一个子集,所以我们先来了解一下TCP/IP协议族。

什么是TCP/IP协议族呢?

计算机与网络设备之间进行互相通信,双方就必须基于一种相同的规则,否则就无法进行通信,我们把这种规则或者标准称之为协议,把与互联网相关的各种协议集合起来总称为TCP/IP协议族。

TCP/IP的通信传输过程: 3.png

与HTTP协议有密切关系的其他协议:

IP协议,TCP协议,DNS协议
IP协议: IP协议的作用是把各种数据包准确的传递给对方,其实最重要的两个条件是IP地址和MAC地址。IP地址指明了节点被分配到的具体地址,MAC地址是指网卡所属的固定地址。IP地址可以和MAC地址进行配对,IP地址可变,但MAC地址基本上不会更改。

TCP协议:
TCP协议位于传输层,提供可靠的字节流服务。
所谓的字节流服务是指,为了方便传输,把大块数据分割成以报文段为单位的数据包进行管理。
为了准确无误的将数据送达目标处,TCP协议采用了三次握手的策略。

什么是三次握手??

发送端首先发送一个带有SYN标记的数据包给对方,接收端收到以后,回传一个带有SYN/ACK标志的数据包以示传达确认信息。最后,发送端再回传一个带有ACK标志的数据包,代表“握手”结束。

2.png

DNS服务:
DNS服务是和HTTP协议一样位于应用层的协议。它提供域名到IP地址之间的解析服务。

4.png

URI和URL

URI的全称是统一资源标识符,就是用来标识互联网资源,这里的资源可以是文档、图像或服务等等。
URI的格式:

URL标识资源的地址(互联网所处的位置)。

2.告知服务器意图的HTTP方法:

  • GET:用来请求访问已被URI识别的资源,指定的资源经服务器解析后返回响应内容
  • POST:传输实体主体
  • PUT:传输文件,由于HTTP/1.1的PUT方法自身不带验证机制,任何人都可以上传文件,存在安全性问题。若配合web应用程序的验证机制,或架构设计采用REST标砖的同类Web网站,就可能会开放使用PUT方法。
  • HEAD:获取报文首部,和GET方法一样,只是不返回报文主体部分,用于确认URI的有效性及资源更新的日期时间等。
  • DELETE: 删除文件,和PUT方法一样不带验证机制。
  • OPTIONS: 用来查询针对请求URI指定的资源支持的方法。
  • TRACE: 追踪路径,客户端发送请求时,在Max-Forwards首部字段中填入数值,每经过一个服务器就将该数字减1,当数值刚好减到0时,就停止继续传输,最后接收到请求的服务器端则返回状态码200 OK的响应,以此方式来追踪发送出去的请求是怎样被加工修改/篡改的。
  • CONNECT: 要求用隧道协议连接代理,CONNECT方法在与代理服务器通信时建立隧道,实现用隧道协议进行TCP通信。主要使用SSL和TLS协议把通信内容经网络隧道传输。

持久连接节省通信量

在HTTP早起版本中,每进行一次HTTP通信就要断开一次TCP连接。随着HTTP的普及,文档中包含大量图片的情况增多,如果每次请求都会造成无谓的TCP连接建立和断开,增加通信量的开销。
为解决上述问题,HTTP/1.1和HTPP/1.0想出了持久连接(也成为HTPP keep-alive),持久连接的特点:只要任意一端没有明确提出断开连接,则保持TCP连接状态

5.png

持久连接的好处在于减少了TCP连接的重复建立和断开所造成的额外开销,减轻了服务端的负载,减少开销的时间使HTTP请求和响应能够更早的结束,提高了web页面的显示速度。

HTTP/1.1中,所有的连接默认都是持久连接。

3. HTTP报文

用于HTTP协议交互的信息被称为HTTP报文,客户端发送的报文称之为请求报文,服务端响应的报文称之为响应报文。HTTP报文大致可以分为报文首部和报文主体两部分。


1.png
编码提升传输速率:

为了提高在传输过程中的速度,HTTP协议中提供了一种内容编码的功能。常见的内容编码有以下几种:

  • gzip (GNU zip)
  • COMPRESS(Unix 系统的标准压缩)
  • deflate(zlib)
  • identity(不进行编码)
分割发送的分块传输编码

在传输大量数据时,通过把数据分割成多块,能够让浏览器逐步显示页面。这种把实体主题分块的功能称为分块传输编码

发送多种数据的多部分对象集合
获取部分内容的范围请求

在实现断点续传的功能的时候,就需要使用范围请求这个字段了。eg.Range: byte = 5001 - 10000

内容协商返回最合适的内容

内容协商机制是指客户端和服务器端就响应的资源内容进行交涉,然后提供给客户端最为合适的资源。内容协商会以语言、字符集、编码方式等为基准判断响应的资源

  • Accept
  • Accept-Charset
  • Accept-Encoding
  • Accept-Language
  • Content-Language

4.从服务器返回请求结果的HTTP状态码

状态码种类 类别 原因短语
1xx (信息性状态码) 接收的请求正在处理
2xx (成功状态码) 请求正常处理完毕
3xx (重定向状态码) 需要进行附加操作以完成请求
4xx (客户端错误状态码) 服务器无法处理请求
5xx (服务器错误状态码) 服务器处理请求出错

5. HTTP报文首部

  1. HTTP报文首部结构

  2. 4种HTTP首部字段类型:

  • 通用首部字段: 请求报文和响应报文都会使用的首部
  • 请求首部字段: 从客户端向服务器发送请求报文时使用的首部,补充了请求的附加内容、客户端信息、响应内容相关优先级等信息
  • 响应首部字段: 从服务器端向客户端返回响应报文时使用的首部。补充了响应的附加内容,也会要求客户端附加额外的内容信息。
  • 实体首部字段:针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新时间等与实体有关的信息。

3.首部字段列表

通用首部字段
首部字段名 说明
Cache-Control 控制缓存的行为
Connection 逐跳首部、连接的管理
Date 创建报文的日期时间
Pragma 报文指令
Trailer 报文末端的首部一览
Transfer-Encoding 指定报文猪蹄的传输编码方式
Upgrade 升级为其他协议
Via 代理服务器的相关信息
Warning 错误通知
请求首部字段
首部字段名 说明
Accept 用户代理可处理的媒体类型
Accept-Charset 优先的字符集
Accept-Encoding 优先的内容编码
Accept-Language 优先的语言
Authorization Web认证信息
Expect 期待服务器的特定行为
From 用户的电子邮箱地址
Host 请求资源所在服务器
If-Match 比较实体标记(Etag)
If-Modified-Since 比较资源的更新时间
If-None-Match 比较实体标记(与If-Match相反)
If-Range 资源未更新时发送实体Byte的范围请求
If-Unmodified-Since 比较资源的更新时间(与If-Modified-Since相反)
Max-Forwards 最大传输逐跳数
Proxy-Authorization 代理服务器要求客户端的认证信息
Range 实体的字节范围请求
Referer 对请求中URI的原始获取方
TE 传输编码的优先级
User-Agent HTTP客户端程序的信息
响应首部字段
首部字段名 说明
Accept-Ranges 是否接受字节范围请求
Age 推算资源创建经过时间
Etag 资源的匹配信息
Location 令客户端重定向至指定URI
Proxy-Authenticate 代理服务器要求客户端的认证信息
Retry-After 对再次发起请求的时机要求
Server HTTP服务器的安装信息
Vary 代理服务器缓存的管理信息
WWW-Authenticate 服务器对客户端的认证信息
实体首部字段
首部字段名 说明
Allow 资源可支持的HTTP方法
Content-Encoding 实体主体使用的编码方式
Content-Language 实体主体的自然语言
Content-Length 实体主体的大小(单位:字节)
Content-Location 替代对应资源的URI
Content-MD5 实体主体的报文摘要
Content-Range 实体主体的位置范围
Content-Type 实体主体的媒体类型
Expires 实体主体过期的日期时间
Last-Modified 资源的最后修改日期时间
Cache-Control

该指令的参数是可多选的,多个指令之间通过‘,’分隔。

Cache-Control:private,max-age=0,no-cache
Expires

缓存服务器在接收到含有Expires的响应后,会以缓存来应答请求,在Expires字段值指定的时间之前,响应的副本会一直被保存。当超过指定时间后,则需要向源服务器发起请求。
max-age优先级高于Expires

Connection

控制代理不再转发

connection:不再转发的首部字段名

管理持久连接

connection: close/keep-alive
Date: 表明创建HTTP报文的日期和时间
Pragma

Pragma是http/1.1之前的历史遗留字段,仅作为与http/1.0的向后兼容而定义,规范定义的形式唯一,如下

pragma:no-cache
Upgrade

用于检测HTTP协议及其他协议是否可使用更高的版本进行通信。其参数值可以用来指定一个完全不同的通信协议。
发送端

GET /index.html HTTP/1.1
Upgrade: TLS/1.0
Connection: Upgrade

服务器端

HTTP/1.1 101 Switching Protocols
Upgrade: TLS/1.0,HTTP/1.1
Connection: Upgrade

Upgrade首部字段产生作用的Upgrade对象仅限于客户端和相邻服务器,所以要与connection属性搭配使用。

If-Match : 只有当If-Match的字段值与Etag值匹配一致时,服务器才会接受请求
If-None-Match:只有在If-None-Match的字段值与Etag值不一致时,可处理该请求,与If-Match相反
If-Modified-Since:如果在If-Modified-Since字段指定的日期时间后,资源发生了更新,服务器会接受请求
If-Unmodified-Since:如果在If-Modified-Since字段指定的日期时间后,资源未更新的情况下,服务器才能处理请求
ETag

用来标识实体的唯一值。ETag分为强ETag和弱ETag。
强ETag值:不论实体发生多么细微的变化都会改变其值
弱ETag值:只有资源发生了根本变化,产生差异时才会改变ETag值,并且会再字段值最开始出附加W/

ETag: W/"errds-123456"
Last-Modified:指明资源最终修改的时间。

6. HTTP缺点

  • 通信使用明文(不加密),内容可能会被窃听
  • 不验证通信方的身份,因此有可能遭遇伪装
  • 无法证明报文的完整性

HTTP协议中没有加密机制,但可以通过和SSL(Secure Socket Layer,安全套接层)或TLS (Transport Layer Security, 安全传输层协议)的组合使用,加密HTTP的通信内容。

用SSL简历安全通信线路之后,就可以在这条线路上进行HTTP通信了。与SSL组合使用的HTTP被称为HTTPS.

HTTP+加密+认证+完整性保护 = HTTPS

虽然HTTPS很可靠,但是也存在一些问题,那就是当使用SSL时,它的处理速度会变慢。一种是指通信变慢。另一种是指由于大量消耗CUP及内存等资源,导致处理速度变慢。因此如果是非敏感信息则使用HTTP通信,只有在包含个人信息等敏感数据时,才利用HTTPS加密通信

相关文章

网友评论

      本文标题:HTTP协议

      本文链接:https://www.haomeiwen.com/subject/dcoaqqtx.html