Http协议

作者: YannisChen_2017 | 来源:发表于2018-12-09 21:22 被阅读64次

    我们平常浏览网页时,一般会先在浏览器地址栏输入URL,之后经过短暂的等待就能看到web页面了。流程如下:


    网页访问示例Demo

    Web页面肯定不会是凭空出来的,它是根据我们在地址栏内输入的URL,从服务器获取到信息,再显示到Web页面。

    Web使用HTTP协议作为规范,完成从用户的客户端到服务器端的一系列流程。可以说Web是建立在Http协议基础上的。那么HTTP协议是什么呢?

    HTTP是什么

    HTTP(HyperText Transfer Protocol 超文本传输协议)是一套计算机通过网络进行通信的规则。HTTP协议使得HTTP客户端(如Web浏览器)能够从HTTP服务器(Web服务器)请求信息和服务,HTTP目前协议的版本是1.1,RPC关于http的描述。HTTP是一种无状态的协议,无状态是指Web浏览器和Web服务器之间不需要建立持久的连接,这意味着当一个客户端向服务器端发出请求,然后Web服务器返回响应(response),连接就被关闭了,在服务器端不保留连接的有关信息.HTTP遵循请求(Request)/应答(Response)模型。Web浏览器向Web服务器发送请求,Web服务器处理请求并返回适当的应答。所有HTTP连接都被构造成一套请求和应答。

    HTTP请求之Request

    客户端发送一个HTTP请求到服务器的请求消息包括以下格式:
    请求行(request line)、请求头部(header)、空行和请求数据四个部分组成。

    Http上传请求消息结构

    我们尝试访问TusCloud,看一下具体的请求。
    浏览器地址栏内输入https://tuscloud.net或直接点击上面的TusCloud超链接。在Chrome浏览器下,打开console查看Network,可以明确的看到以下信息。

    *general*
    Request URL: https://tuscloud.net/
    Request Method: GET
    Status Code: 200 OK
    Remote Address: 47.94.57.117:443
    Referrer Policy: no-referrer-when-downgrade
    
    *request headers*
    Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
    Accept-Encoding: gzip, deflate, br
    Accept-Language: zh-CN,zh;q=0.9
    Cache-Control: max-age=0
    Connection: keep-alive
    Cookie: _icl_current_language=zh-hans
    Host: tuscloud.net
    If-Modified-Since: Thu, 01 Jan 1970 00:00:00 GMT
    If-None-Match: "7b042b98ed8197bc245a6131065788bb"
    Upgrade-Insecure-Requests: 1
    User-Agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36
    
    • 请求行

    Request URL: https://tuscloud.net/
    Request Method: GET

    以GET方式访问URL地址为https://tuscloud.net/的资源

    注意:请求方法(所有方法全为大写)有多种,各个方法的解释如下
    HTTP1.0定义了三种请求方法: GET, POST 和 HEAD方法。
    HTTP1.1新增了五种请求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。
    GET 请求指定的页面信息,并返回实体主体。
    HEAD 类似于get请求,只不过返回的响应中没有具体的内容,用于获取报头
    POST 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。
    POST请求可能会导致新的资源的建立和/或已有资源的修改。

    PUT 从客户端向服务器传送的数据取代指定的文档的内容。
    DELETE 请求服务器删除指定的页面。
    CONNECT HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。
    OPTIONS 允许客户端查看服务器的性能。
    TRACE 回显服务器收到的请求,主要用于测试或诊断。

    • 请求头部
      经常用到的参数说明
      HOST将指出请求的目的地,表示请求的域名是https://tuscloud.net.如果一台服务器有多个网站,服务器就需要通过Host来区分浏览器请求的是哪个网站.
      User-Agent会告诉网站服务器,访问者是通过什么工具来请求的.该信息由你的浏览器来定义,并且在每个请求中自动发送等等.
      Content-Type请求体的MIME类型 (用于POST和PUT请求中) 示例:application/x-www-form-urlencoded
      Content-Length以8进制表示的请求体的长度

    • 请求数据也叫主体,可以添加任意的其他数据。
      这个示例中的请求数据为空。不过可以点击其他页面。例如
      https://tuscloud.net/wp-includes/js/wp-emoji-release.min.js?ver=4.9

    ver: 4.9
    

    上面代码框内的数据及请求数据。

    HTTP之响应消息Response

    HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文。
    示例:

    HTTP/1.1 200 OK
    Date: Sat, 08 Dec 2018 08:39:42 GMT
    Content-Type: text/html; charset=UTF-8
    
    <html>
          <head></head>
          <body>
                <!--body goes here-->
          </body>
    </html>
    
    • 状态行,由HTTP协议版本号, 状态码, 状态消息 三部分组成。
      第一行为状态行,(HTTP/1.1)表明HTTP版本为1.1版本,状态码为200,状态消息为(ok)
    • 消息报头,用来说明客户端要使用的一些附加信息
      第二行和第三行为消息报头,
      Date:生成响应的日期和时间;Content-Type:指定了MIME类型的HTML(text/html),编码类型是UTF-8
    • 空行,消息报头后面的空行是必须的
    • 响应正文,服务器返回给客户端的文本信息。
      空行后面的html部分为响应正文。

    单次的Http详细过程如下:


    单次HTTP请求的各个阶段

    在图例中可以看到Http协议是一个应用层的协议,基于传输层的TCP协议及网络层的IP协议。

    HTTP之状态码

    状态代码有三位数字组成,第一个数字定义了响应的类别,共分五种类别:

    1xx:指示信息--表示请求已接收,继续处理
    2xx:成功--表示请求已被成功接收、理解、接受
    3xx:重定向--要完成请求必须进行更进一步的操作
    4xx:客户端错误--请求有语法错误或请求无法实现
    5xx:服务器端错误--服务器未能实现合法的请求

    常见状态码:

    200 OK //客户端请求成功
    400 Bad Request //客户端请求有语法错误,不能被服务器所理解
    401 Unauthorized //请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
    403 Forbidden //服务器收到请求,但是拒绝提供服务
    404 Not Found //请求资源不存在,eg:输入了错误的URL
    500 Internal Server Error //服务器发生不可预期的错误
    503 Server Unavailable //服务器当前不能处理客户端的请求,一段时间后可能恢复正常

    附录一:其他详细状态码参见rfc2616
    附录二:其他的参数参见文档常用的HTTP请求头与响应头

    相关文章

      网友评论

        本文标题:Http协议

        本文链接:https://www.haomeiwen.com/subject/fzkycqtx.html