美文网首页
2019-01-28/HTTP与网络

2019-01-28/HTTP与网络

作者: 阿九_beta | 来源:发表于2019-01-28 19:22 被阅读0次

    这篇文章对http的重点内容进行一个总结摘录

    1. HTTP报文

    HTTP报文是在HTTP应用程序之间发送的数据块。这些数据块以一些文本形式的元信息开头,描述报文的内容及含义,后面跟着可选的数据部分。每个报文都包含一条来自客户端的请求或者一条来自服务器的响应,由3个部分组成:

    对报文进行描述的起始行 —— start line
    包含属性的首部块 —— header
    可选的包含数据的主体部分 —— body

    报文分为请求报文和响应报文,请求报文向服务器请求一个动作;响应报文把响应返回给客户端。
    客户端向服务器发送请求的方式有:get/put/post/trace/head/delete/options.

    2. 用js构建一个简单的服务器

    var http = require('http')
    
    http.createServer(function(req, res){
        console.log(req.headers)
        res.setHeader('Content-Type','text/html') //服务器使用html解析内容
        res.setHeader('Set-Cookie',['id=1234', 'name=yss'])
        res.statusCode = 200
        res.statusMessage = 'OK'
        res.end('<p>hello world</p>') //服务器响应的内容
        
    }).listen(8080) //监听8080端口
    

    3. 常见状态码

    • 200 OK
      一切正常,对GET和POST请求的应答文档跟在后面。
    • 202 Accepted
      已经接受请求,但处理尚未完成。
    • 301 Moved Permanently
      客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。
    • 304 Not Modified
      客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告 诉客户,原来缓冲的文档还可以继续使用。
    • 403 Forbidden
      资源不可用。服务器理解客户的请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置导致。
    • 404 Not Found
      无法找到指定位置的资源。这也是一个常用的应答。
    • 500 Internal Server Error
      服务器遇到了意料不到的情况,不能完成客户的请求。

    4. 缓存机制

    当缓存过期后, 浏览器不会直接去服务器上拿缓存, 而是判断缓存是否有更新, 能否继续使用, 判断的方法有两种:

    (1) Etag和If-None-Match

    Cache-Control: max-age=300;
    ETag:W/"e-cbxLFQW5zapn79tQwb/g6Q"
    

    浏览器第一次请求a.jpg 时,服务器会发送完整的文件并附带额外信息,其中Etag 是 对a.jpg文件的编码,如果a.jpg在服务端未被修改,这个值就不会变 。
    浏览器把a.jpg和额外信息保存到本地。假如浏览器在300秒以内再次需要获取a.jpg时,浏览器直接从缓存读取a.jpg(200, from xx cache)。假如浏览器在300秒之后再次需要获取a.jpg时,浏览器发现该缓存的文件已经不新鲜了,于是就向服务器发送请求 重新获取a.jpg, 在发送请求的时候附带刚刚保存的a.jpg的ETag ( If-None-Match:W/"e-cbxLFQW5zapn79tQwb/g6Q")。 服务器在接收到请求后拿浏览器请求的 Etag 和当前文件重新计算后端 Etag 做个比较,如果二者相等表示文件在未修改则发送个短消息(响应头,不包含图片内容, 304),如果二者不等则发送新文件和新的 ETag,浏览器获取新文件并更新该文件的 Etag。
    服务器会响应一个Etag字段, 一个表示文件唯一的字符串, 一旦文件更新, Etag也会跟着更改, 当缓存过期后, 浏览器会把这个字符串放在If-None-Match去请求服务器, 判断是否有更新。

    (2)Last-Modified 和 If-Modified-Since

    浏览器发送求情后,服务器会响应一个Last-Modified字段, 表示最近一次修改缓存的时间, 当缓存过期后, 浏览器就会把这个时间放在If-Modified-Since去请求服务器, 判断缓存是否有更新。

    (3)两种方法的对比

    Etag的优先级比Last-Modified的更高, Etag的出现, 是为了解决一个缓存文件在短时间内被多次修改的问题, 因为Last-Modified只能精确到秒。

    5. cookie和session

    (1)cookie

    cookie是存储在浏览器上的一小段数据,用来记录某些当页面关闭或者刷新后仍然需要记录的信息。在控制台用「document.cookie」查看你当前正在浏览的网站的cookie。cookie可以使用 js 在浏览器直接设置(用于记录不敏感信息,如用户名), 也可以在服务端通使用 HTTP 协议规定的 set-cookie 来让浏览器种下cookie,这是最常见的做法。每次网络请求 Request headers 中都会带上cookie。所以如果 cookie 太多太大对传输效率会有影响。一般浏览器存储cookie 最大容量为4k,所以大量数据不要存到cookie。

    问题:很多网站的静态资源使用CDN地址而是使用当前网站域名,从cookie的角度说说这对性能有何影响?
    答案:

    避免域名污染。 当浏览器向服务器请求一个静态资源时,会先发送同域名下的 cookie,服务器对于这些 cookie 不会做任何处理。因此它们只是在毫无意义的消耗带宽。所以你应该确保对于静态内容的请求是无coockie的请求。
    如果给 http://126.com设置了cookie,那么会感染所有子域名, 请求 http://www.126.com/logo.gif或者image.126.com/logo.gif 时便会带上讨厌的cookie。
    所以要用单独的域名,以减少请求,提高网页性能。

    作者:雷霆
    链接:https://www.zhihu.com/question/20534662/answer/15408245
    来源:知乎
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    (2)session

    当一个用户打开淘宝登录后,刷新浏览器仍然展示登录状态。服务器如何分辨这次发起请求的用户是刚才登录过的用户呢?这里就使用了session保存状态。用户在输入用户名密码提交给服务端,服务端验证通过后会创建一个session用于记录用户的相关信息,这个 session 可保存在服务器内存中,也可保存在数据库中。

    创建session后,服务端会把关联的session_id 通过setCookie 添加到http响应头部中。
    浏览器在加载页面时发现响应头部有 set-cookie字段,就把这个cookie 种到浏览器指定域名下。
    当下次刷新页面时,发送的请求会带上这条cookie, 服务端在接收到后根据这个session_id来识别用户。

    (3)cookie和session对比

    cookie 是存储在浏览器里的一小段「数据」,而session是一种让服务器能识别某个用户的「机制」,session 在实现的过程中需要使用cookie。 二者不是同一维度的东西。

    相关文章

      网友评论

          本文标题:2019-01-28/HTTP与网络

          本文链接:https://www.haomeiwen.com/subject/sdczjqtx.html