美文网首页
HTTP协议

HTTP协议

作者: 头脑之外 | 来源:发表于2018-11-25 23:50 被阅读0次

    引用
    学习Web开发不好好学习HTTP报文,将会“打拳不练功,到老一场空”,你花在犯迷糊上的时间比你沉下心来学习HTTP的时间肯定会多很多。

    首先,明白什么是HTTP

    HTTP是hypertexttransfer protocol(超文本传输协议)的简写,它是TCP/IP协议的一个应用层协议,用于定义WEB浏览器与WEB服务器之间交换数据的过程。

    HTTP协议是学习JavaWEB开发的基石,不深入了解HTTP协议,就不能说掌握了WEB开发,更无法管理和维护一些复杂的WEB站点。HTTP协议的版本:HTTP/1.0、HTTP/1.1

    然后,明白HTTP/1.0和HTTP/1.1的区别:

    HTTP1.0协议:客户端与web服务器建立连接后,只能获得一个web资源,在获取资源之后就断开连接。

    HTTP1.1协议:允许客户端与web服务器建立连接后,在一个连接上获取多个web资源都不会断开连接,除非是访问出错和手动断开连接。

    HTTP请求报文解剖

    HTTP请求报文由3部分组成(请求行+请求头+请求体)

    请求报文结构

    利用火狐浏览器来看的话更清晰:


    http

    下面是一个实际的请求报文:


    实际的请求报文

    ①是请求方法,GET和POST是最常见的HTTP方法,除此以外还包括DELETE、HEAD、OPTIONS、PUT、TRACE。不过,当前的大多数浏览器只支持GET和POST,Spring 3.0提供了一个HiddenHttpMethodFilter,允许你通过“_method”的表单参数指定这些特殊的HTTP方法(实际上还是通过POST提交表单)。服务端配置了HiddenHttpMethodFilter后,Spring会根据_method参数指定的值模拟出相应的HTTP方法,这样,就可以使用这些HTTP方法对处理方法进行映射了。

    ②为请求对应的URL地址,它和报文头的Host属性组成完整的请求URL,③是协议名称及版本号。

    ④是HTTP的报文头,报文头包含若干个属性,格式为“属性名:属性值”,服务端据此获取客户端的信息。

    ⑤是报文体,它将一个页面表单中的组件值通过param1=value1&param2=value2的键值对形式编码成一个格式化串,它承载多个请求参数的数据。不但报文体可以传递请求参数,请求URL也可以通过类似于“/chapter15/user.html? param1=value1&param2=value2”的方式传递请求参数。

    对照上面的请求报文,我们把它进一步分解,你可以看到一幅更详细的结构图:


    详细结构分解图

    HTTP请求报文头属性

    报文头属性是什么东西呢?我们不妨以一个小故事来说明吧。

    引用
    快到中午了,张三丰不想去食堂吃饭,于是打电话叫外卖:老板,我要一份[鱼香肉丝],要12:30之前给我送过来哦,我在江湖湖公司研发部,叫张三丰。

    这里,你要[鱼香肉丝]相当于HTTP报文体,而“12:30之前送过来”,你叫“张三丰”等信息就相当于HTTP的报文头。它们是一些附属信息,帮忙你和饭店老板顺利完成这次交易。

    请求HTTP报文和响应HTTP报文都拥有若干个报文关属性,它们是为协助客户端及服务端交易的一些附属信息。

    常见的HTTP请求报文头属性

    Accept

    请求报文可通过一个“Accept”报文头属性告诉服务端 客户端接受什么类型的响应。

    如下报文头相当于告诉服务端,俺客户端能够接受的响应类型仅为纯文本数据啊,你丫别发其它什么图片啊,视频啊过来,那样我会歇菜的~~~:

    Accept:text/plain
    Accept属性的值可以为一个或多个MIME类型的值
    

    Cookie
    客户端的Cookie就是通过这个报文头属性传给服务端的哦!如下所示:

    Cookie: $Version=1; Skin=new;jsessionid=5F4771183629C9834F8382E23BE13C4C
    服务端是怎么知道客户端的多个请求是隶属于一个Session呢?
    注意到后台的那个jsessionid=5F4771183629C9834F8382E23BE13C4C木有?
    原来就是通过HTTP请求报文头的Cookie属性的jsessionid的值关联起来的!
    (当然也可以通过重写URL的方式将会话ID附带在每个URL的后面哦)。 
    

    Referer
    表示这个请求是从哪个URL过来的,假如你通过google搜索出一个商家的广告页面,你对这个广告页面感兴趣,鼠标一点发送一个请求报文到商家的网站,这个请求报文的Referer报文头属性值就是http://www.google.com

    引用
    唐僧到了西天.
    如来问:侬是不是从东土大唐来啊?
    唐僧:厉害!你咋知道的!
    如来:呵呵,我偷看了你的Referer...

    很多貌似神奇的网页监控软件(如著名的 我要啦),只要在你的网页上放上一段JavaScript,就可以帮你监控流量,全国访问客户的分布情况等报表和图表,其原理就是通过这个Referer及其它一些HTTP报文头工作的。

    Cache-Control
    对缓存进行控制,如一个请求希望响应返回的内容在客户端要被缓存一年,或不希望被缓存就可以通过这个报文头达到目的。

    如以下设置,相当于让服务端将对应请求返回的响应内容不要在客户端缓存:

    Cache-Control: no-cache
    
    其它请求报文头属性
    如何访问请求报文头

    由于请求报文头是客户端发过来的,服务端当然只能读取了,以下是HttpServletRequest一些用于读取请求报文头的API:


    heads.jpg

    HTTP响应报文解剖

    响应报文结构

    HTTP的响应报文也由三部分组成(响应行+响应头+响应体):

    响应报文
    以下是一个实际的HTTP响应报文:
    HTTP响应报文
    ①报文协议及版本;
    ②状态码及状态描述;
    ③响应报文头,也是由多个属性组成;
    ④响应报文体,即我们真正要的“干货”。
    响应状态码

    和请求报文相比,响应报文多了一个“响应状态码”,它以“清晰明确”的语言告诉客户端本次请求的处理结果。

    HTTP的响应状态码由5段组成:

    1xx 消息,一般是告诉客户端,请求已经收到了,正在处理,别急...
    2xx 处理成功,一般表示:请求收悉、我明白你要的、请求已受理、已经处理完成等信息.
    3xx 重定向到其它地方。它让客户端再发起一个请求以完成整个处理。
    4xx 处理发生错误,责任在客户端,如客户端的请求一个不存在的资源,客户端未被授权,禁止访问等。
    5xx 处理发生错误,责任在服务端,如服务端抛出异常,路由出错,HTTP版本不支持等。

    以下是几个常见的状态码:

    200 OK

    你最希望看到的,即处理成功!

    303 See Other

    我把你redirect到其它的页面,目标的URL通过响应报文头的Location告诉你。

    引用

    悟空:师傅给个桃吧,走了一天了 image 唐僧:我哪有桃啊!去王母娘娘那找吧 image

    304 Not Modified

    告诉客户端,你请求的这个资源至你上次取得后,并没有更改,你直接用你本地的缓存吧,我很忙哦,你能不能少来烦我啊!

    404 Not Found

    你最不希望看到的,即找不到页面。如你在google上找到一个页面,点击这个链接返回404,表示这个页面已经被网站删除了,google那边的记录只是美好的回忆。

    500 Internal Server Error

    看到这个错误,你就应该查查服务端的日志了,肯定抛出了一堆异常,别睡了,起来改BUG去吧

    有些响应码,Web应用服务器会自动给生成。你可以通过HttpServletResponse的API设置状态码:

    //设置状态码,状态码在HttpServletResponse中通过一系列的常量预定义了,如SC_ACCEPTED,SC_OK  
    void    setStatus(int sc)   
    
    常见的HTTP响应报文头属性

    Cache-Control

    响应输出到客户端后,服务端通过该报文头属告诉客户端如何控制响应内容的缓存。

    下面,的设置让客户端对响应内容缓存3600秒,也即在3600秒内,如果客户再次访问该资源,直接从客户端的缓存中返回内容给客户,不要再从服务端获取(当然,这个功能是靠客户端实现的,服务端只是通过这个属性提示客户端“应该这么做”,做不做,还是决定于客户端,如果是自己宣称支持HTTP的客户端,则就应该这样实现)。

    Cache-Control: max-age=3600  
    

    ETag

    一个代表响应服务端资源(如页面)版本的报文头属性,如果某个服务端资源发生变化了,这个ETag就会相应发生变化。它是Cache-Control的有益补充,可以让客户端“更智能”地处理什么时候要从服务端取资源,什么时候可以直接从缓存中返回响应。

    Spring 3.0还专门为此提供了一个org.springframework.web.filter.ShallowEtagHeaderFilter(实现原理很简单,对JSP输出的内容MD5,这样内容有变化ETag就相应变化了),用于生成响应的ETag,因为这东东确实可以帮助减少请求和响应的交互。

    下面是一个ETag:

    ETag: "737060cd8c284d8af7ad3082f209582d"  
    

    Location

    我们在JSP中让页面Redirect到一个某个A页面中,其实是让客户端再发一个请求到A页面,这个需要Redirect到的A页面的URL,其实就是通过响应报文头的Location属性告知客户端的,如下的报文头属性,将使客户端redirect到iteye的首页中:

    Location: http://www.iteye.com  
    

    Set-Cookie

    服务端可以设置客户端的Cookie,其原理就是通过这个响应报文头属性实现的:

    Set-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1  
    

    其它HTTP响应报文头属性

    如何写HTTP请求报文头

    在服务端可以通过HttpServletResponse的API写响应报文头的属性:

    //添加一个响应报文头属性  
    void setHeader(String name, String value)   
    

    像Cookie,Location这些响应都是有福之人,HttpServletResponse为它们都提供了VIP版的API:

    //添加Cookie报文头属性  
    void addCookie(Cookie cookie)   
    //不但会设置Location的响应报文头,还会生成303的状态码呢,两者天仙配呢  
    void sendRedirect(String location)   
    

    相关文章

      网友评论

          本文标题:HTTP协议

          本文链接:https://www.haomeiwen.com/subject/xtamqqtx.html