HTTP详解

作者: MachinePlay | 来源:发表于2019-06-27 16:45 被阅读0次

    1.什么是HTTP?

    HTTP是超文本传输协议 Hyper Text Transfer Protocol的缩写,是利用万维网将超文本从服务器传输到本地客户端的协议。

    HTTP是一个基于TCP/IP通信协议的应用层协议。

    2.HTTP工作原理

    HTTP工作于客户端-服务器框架,浏览器作为客户端向服务器发送HTTP请求,服务器接收到请求后发送HTTP响应,默认使用80端口。

    HTTP具有无连接媒体独立无状态三大特性:

    • 无连接: 每次连接只处理一个请求,服务器收到客户请求并收到客户应答后就断开。
    • 媒体独立:只要客户端和服务器知道如何处理数据结构,HTTP可以发送任何数据
    • 无状态:HTTP是无状态协议,即对处理的事务没有记忆能力,如果后续处理需要前面的信息,就必须重传。

    3.HTTP消息结构

    HTTP消息是客户向服务器的请求或者服务器向客户的响应。请求和响应的格式是相似的。

    消息部分 内容
    请求行/响应行 指定请求或者响应的目的
    请求头/响应头 指定元数据,例如消息内容大小、编码方式
    空行 紧接着一个空行
    可选消息体 可选的请求和响应数据

    一个HTTP请求消息的具体格式如下:


    HTTP请求消息

    HTTP响应消息如下:


    HTTP响应消息

    请求:

    POST /hello.txt HTTP/1.1                                        #请求行 方法、资源URI、协议版本
    User-Agent: curl/7.16.3 libcurl/7.16.3 OpenSSL/0.9.7l zlib/1.2.3# 请求头 编码方式、浏览器信息
    Accept-Language= zh-cn
    Accept-Encoding= gzip,deflate
    Host: www.example.com:80
                                                                    #空行
    uname=123456                                                    #可选数据
    

    响应:

    HTTP/1.1 200 OK #状态行 协议版本 状态码
    Date: Mon, 27 Jul 2009 12:28:53 GMT # 响应头
    Server: Apache
    Last-Modified: Wed, 22 Jul 2009 19:15:56 GMT
    ETag: "34aa387-d-1568eb00"
    Accept-Ranges: bytes
    Content-Length: 51
    Vary: Accept-Encoding
    Content-Type: text/plain
    #空行
    #内容
    
    

    4.HTTP请求方法

    HTTP 协议的 8 种请求类型介绍

    HTTP 协议中共定义了八种方法或者叫“动作”来表明对 Request-URI 指定的资源的不同操作方式,具体介绍如下:

    OPTIONS:返回服务器针对特定资源所支持的HTTP请求方法。也可以利用向Web服务器发送'*'的请求来测试服务器的功能性。

    HEAD:向服务器索要与GET请求相一致的响应,只不过响应体将不会被返回。这一方法可以在不必传输整个响应内容的情况下,就可以获取包含在响应消息头中的元信息。

    GET:向特定的资源发出请求。

    POST:向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的创建和/或已有资源的修改。

    PUT:向指定资源位置上传其最新内容。

    DELETE:请求服务器删除 Request-URI 所标识的资源。

    TRACE:回显服务器收到的请求,主要用于测试或诊断。

    CONNECT:HTTP/1.1 协议中预留给能够将连接改为管道方式的代理服务器。

    虽然 HTTP 的请求方式有 8 种,但是我们在实际应用中常用的也就是 get 和 post,其他请求方式也都可以通过这两种方式间接的来实现。

    5.HTTP响应头信息

    HTTP 响应头信息
    HTTP请求头提供了关于请求,响应或者其他的发送实体的信息。

    在本章节中我们将具体来介绍HTTP响应头信息。

    Allow 服务器支持哪些请求方法(如GET、POST等)。
    Content-Encoding 文档的编码(Encode)方法。只有在解码之后才可以得到Content-Type头指定的内容类型。利用gzip压缩文档能够显著地减少HTML文档的下载时间。Java的GZIPOutputStream可以很方便地进行gzip压缩,但只有Unix上的Netscape和Windows上的IE 4、IE 5才支持它。
    因此,Servlet应该通过查看Accept-Encoding头(request.getHeader("Accept-Encoding"))
    检查浏览器是否支持gzip,为支持gzip的浏览器返回经gzip压缩的HTML页面,为其他浏览器返回普通页面。

    Content-Length
    表示内容长度。只有当浏览器使用持久HTTP连接时才需要这个数据。如果你想要利用持久连接的优势,可以把输出文档写入 ByteArrayOutputStream,完成后查看其大小,然后把该值放入Content-Length头,最后通过byteArrayStream.writeTo(response.getOutputStream()发送内容。

    Content-Type
    表示后面的文档属于什么MIME类型。Servlet默认为text/plain,但通常需要显式地指定为text/html。由于经常要设置Content-Type,因此HttpServletResponse提供了一个专用的方法setContentType

    Date
    当前的GMT时间。你可以用setDateHeader来设置这个头以避免转换时间格式的麻烦。

    Expires
    应该在什么时候认为文档已经过期,从而不再缓存它?

    Last-Modified
    文档的最后改动时间。客户可以通过If-Modified-Since请求头提供一个日期,该请求将被视为一个条件GET,只有改动时间迟于指定时间的文档才会返回,否则返回一个304(Not Modified)状态。Last-Modified也可用setDateHeader方法来设置。

    Location
    表示客户应当到哪里去提取文档。Location通常不是直接设置的,而是通过HttpServletResponse的sendRedirect方法,该方法同时设置状态代码为302。

    Refresh
    表示浏览器应该在多少时间之后刷新文档,以秒计。除了刷新当前文档之外,你还可以通过setHeader("Refresh", "5; URL=http://host/path")让浏览器读取指定的页面。
    注意这种功能通常是通过设置HTML页面HEAD区的<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://host/path">实现,这是因为,自动刷新或重定向对于那些不能使用CGI或Servlet的HTML编写者十分重要。但是,对于Servlet来说,直接设置Refresh头更加方便。

    注意Refresh的意义是"N秒之后刷新本页面或访问指定页面",而不是"每隔N秒刷新本页面或访问指定页面"。因此,连续刷新要求每次都发送一个Refresh头,而发送204状态代码则可以阻止浏览器继续刷新,不管是使用Refresh头还是<META HTTP-EQUIV="Refresh" ...>

    注意Refresh头不属于HTTP 1.1正式规范的一部分,而是一个扩展,但Netscape和IE都支持它。

    Server
    服务器名字。Servlet一般不设置这个值,而是由Web服务器自己设置。

    Set-Cookie
    设置和页面关联的Cookie。Servlet不应使用response.setHeader("Set-Cookie", ...),而是应使用HttpServletResponse提供的专用方法addCookie。参见下文有关Cookie设置的讨论。

    WWW-Authenticate
    客户应该在Authorization头中提供什么类型的授权信息?在包含401(Unauthorized)状态行的应答中这个头是必需的。例如,response.setHeader("WWW-Authenticate", "BASIC realm=\"executives\"")
    注意Servlet一般不进行这方面的处理,而是让Web服务器的专门机制来控制受密码保护页面的访问(例如.htaccess)。

    6.HTTP状态码

    当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。

    HTTP状态码的英文为HTTP Status Code。

    下面是常见的HTTP状态码:

    200 - 请求成功
    301 - 资源(网页等)被永久转移到其它URL
    302 -与301类似。但资源只是临时被移动。客户端应继续使用原有URI
    404 - 请求的资源(网页等)不存在
    500 - 内部服务器错误

    分类 分类描述
    1** 信息,服务器收到请求,需要请求者继续执行操作
    2** 成功,操作被成功接收并处理
    3** 重定向,需要进一步的操作以完成请求
    4** 客户端错误,请求包含语法错误或无法完成请求
    5** 服务器错误,服务器在处理请求的过程中发生了错误

    相关文章

      网友评论

        本文标题:HTTP详解

        本文链接:https://www.haomeiwen.com/subject/ekurcctx.html