美文网首页工作生活
独上高楼-HTTP协议(1):从RFC开始

独上高楼-HTTP协议(1):从RFC开始

作者: 唔六 | 来源:发表于2019-07-04 22:20 被阅读0次

这是一系列文章的开始,工作了这么久,发现很多人对http和web有不少的误解。大家都在希望web交互的更快,使用webGL来充实内容,使用各类hybrid框架来实现一统所有平台的意愿,却很少有人去深刻理解http的诞生、成长。

从90年代开始,http作为web的附庸而逐渐成长,这么多年过去了,http的应用领域已经不仅仅局限在web,各种http的变体充斥在各个角落。在这个技术快速迭代的年代,就越需要理解技术的本质。每个技术从业者应该多问以下问题:

  • 我用的技术会死去吗
  • 更好的技术是什么

放在web领域,也应该问下自己:

  • web和http会死去吗
  • 他们的替代品将是什么

介绍

在1999年的RFC 2616是这样描述http的设计目的:

HTTP has been in use by the World-Wide Web global information initiative since 1990.

http从诞生之初,就已经与万维网有不可割舍的血缘关系。因为当时万维网的特性,形成了我们耳熟能详的特性

  • 请求简单
  • 传输数据灵活
  • 无连接
  • 无状态

近二十年来,HTTP/1.1标准的内涵不挺的外延,甚至需要6个RFC来描述整个HTTP协议,他们是:

  • 消息-"Message Syntax and Routing" (RFC 7230)
  • 语义-"Semantics and Content" [RFC7231]
  • 条件请求-"Conditional Requests" [RFC7232]
  • 范围请求-"Range Requests" [RFC7233]
  • 缓存-"Caching" [RFC7234]
  • 认证-"Authentication" [RFC7235]

http 2.0已经蓬勃兴起, google的QUIC(笑称http 3.0)也在实验阶段,他们可能在安全、传输等方面有较大的优化,但是他们并没有给http赋予新的内涵:

HTTP is a generic interface protocol for information systems. It is designed to hide the details of how a service is implemented by presenting a uniform interface to clients that is independent of the types of resources provided. RFC7230

HTTP是一种通用的信息传递协议。对http来讲,Web世界将只是很少的一部分。

从RFC7230开始

先从几个问题开始:

  1. 什么决定了服务端和客户端

  2. 为什么必须要使用空行隔开headerbody

  3. URI是什么?

实际上,这篇RFC解决了七十多个问题,每一个问题都可以写一篇较长的文章来讲,这里分析一下这三个问题:

message格式决定服务端和客户端

标准规定,如果发出的是 response格式的消息,那么就属于server,反之,就是client

仅仅使用数据格式来决定的地位, 为什么不用tcp特性来决定服务端还是客户端问题?

google使用的QUIC是基于UDP实现的HTTP标准(有一定差异)。这就没有办法来通过请求行为来判断是服务端还是客户端,更重要的是,在web世界,各种代理、网关等充斥在各个角落,客户端和服务端的角色经常发生变化,因此,使用格式来决定地位是一个相对不错的解决方案。

这也就是requestresponse消息头不一样的绝对原因(讲道理,可以设计的一样)。

思考HTTP的时候,希望可以脱离那句话来想象:

HTTP是基于TCP的应用层协议

自定义消息头

常见的请求如下:

GET / HTTP/1.0
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_5)
Accept: */*

body

常见回复如下:

HTTP/1.0 200 OK 
Content-Type: text/plain
Content-Length: 137582
Expires: Thu, 05 Dec 1997 16:00:00 GMT
Last-Modified: Wed, 5 August 1996 15:55:28 GMT
Server: Apache 0.84

<html>
  <body>Hello World</body>
</html>

headerbody中间存在一个empty line。这是因为,标准允许服务端或者客户端自定义消息头,为了区分headerbody,标准通过设置空行来进行区分。在某些需求下,你可以将内容写在header区域,防止body内内容被防火墙或者杀毒软件干掉。

为什么不设置固定的header或者body

http在设计之初,就用于传输各种多媒体信息,因此从一开始,headerbody的内容就没办法进行固定。从目前来看,HTTP承载最多的也是各种信息资源的传递。所以,在这个角度:

http传输某种资源不会是最优的方案,但是一定可以传输任意资源

HTTP灵魂: 资源定位

HTTP发明者Tim Berners-Lee有句名言:

Web users ultimately want to get at data quickly and easily. They don't care as much about attractive sites and pretty design.

对于创始人来说:更快的获取数据是web的唯一使命。

使用URI来描述资源,就是能够简化获取资源的步骤。

那么,URI的结构是什么?URI将永远不变吗?

相关文章

  • 独上高楼-HTTP协议(1):从RFC开始

    这是一系列文章的开始,工作了这么久,发现很多人对http和web有不少的误解。大家都在希望web交互的更快,使用w...

  • 独上高楼-HTTP协议(2):URI

    如我所见的,一模一样的我我感到的我是那个真我吗? 在web世界,URI用于指示资源。 为了简单,URI被设计为上下...

  • HTTP

    参考:HTTP协议详解HTTP协议处理流程 HTTP练习沙箱:httpbin.org 官方文档:IETF RFC2...

  • 关于HTTP协议

    HTTP协议规定浏览器和服务器之间是如何交互的 版本 HTTP 1.0:RFC-1945 HTTP 1.1:RFC...

  • HTTP RFC (上)

    组织:中国互动出版网(http://www.china-pub.com/) RFC文档中文翻译计划(http://...

  • 【HTTP】http header 过大导致前端无法请求问题排查

    在学习 HTTP 协议的时候,除了阅读 RFC2616 等 RFC 文档,还可以参考 MDN(Mozilla De...

  • HTTP协议

    参考文档/书籍 ·RFC文档 ·图解HTTP ·HTTP权威指南 HTTP协议是请求响应式协议,一次请求跟一次响应...

  • websocket

    是什么: websocket协议[http://datatracker.ietf.org/doc/rfc6455/...

  • 怎么实现上传/下载任务的断点续传

    Range & Content-Range HTTP1.1 协议(RFC2616)开始支持获取文件的部分内容,这为...

  • websocket

    Websocket 协议 Websocket 遵循 rfc6455 标准。websocket使用HTTP作为它的传...

网友评论

    本文标题:独上高楼-HTTP协议(1):从RFC开始

    本文链接:https://www.haomeiwen.com/subject/mzbdhctx.html