美文网首页程序员
NODEJS--HTTP实现分析

NODEJS--HTTP实现分析

作者: 字节跳动技术团队 | 来源:发表于2018-05-17 18:47 被阅读0次

    1.前言

    目前,HTTP协议是互联网上应用最为广泛的一种网络协议,也是前端er接触最多的一种协议。通过阅读http模块在nodejs中的实现,能够更深入的了解HTTP协议。HTTP协议是基于TCP协议之上的应用层协议,它的实现离不开TCP/IP协议族。而具体到代码实现,http模块依赖于net模块。

    如下图所示:在nodejs中,http通过net模块传输数据,得到数据之后依靠HTTP_PARSER对数据进行解析。

    image

    2.源码

    启动一个HTTP服务

    nodejs中启动一个HTTP服务很简单,就是实例化一个Server对象,并且监听某个端口:

    image

    SERVER类

    Server类继承于net.Server,并监听’connection‘事件。

    image

    在Server类中,主要做了两件事:

    1. 初始化NET模块并建立TCP网络监听

    2. 监听自身的request事件。

    当客户端请求到来的时候,Server实例会首先监听到 'connection' 事件,建立起TCP连接并在connectionListener中暴露出socket对象。接下来,HTTP模块就通过socket对象与客户端进行数据交互。

    当一个请求到来后,Server会触发自身的 request 事件,调用 requestListener 方法,即创建Server实例时传入的回调函数。

    image

    socket对象类似于TCP协议的一个实现,可以通过它与客户端进行数据交互;

    在 connectionListener 函数中,还初始化了parser实例,并给它绑定了一个 onIncoming 函数 HTTP Parser;
    整个解析流程在 connectionListener 中进行,socket 通过 'data' 事件获取TCP推入的数据。

    当socket获取到数据之后,会先对数据进行解析,即:parser.excute(),解析工具是parser。值得说明的是,作者为了实现对 parser 的重用, parser是从一个'FreeList池'中获取的。

    image

    Parser(common.js) 继承自 HTTPParser(node_http_parser.cc),并绑定了4个解析周期回调函数:parserOnHeaders、parserOnHeadersComplete、parserOnBody、parserOnMessageComplete。

    在执行 parser.execute 过程中,HTTPParser 会在解析周期内回调这些函数。

    image

    解析的具体流程

    1、TCP数据到达时, 先执行execute()

    image

    2、顺藤摸瓜,我们发现parser.excute 就是 Excute(node_http_parser.cc)。而Excute也只是一个外包而已,具体工作是http_parser_excute(http_parser.c)搞定的。

    node_http_parser.cc 只是对 http_parser.c 的一层包装,http_parser.c依靠对外暴露的7个回调周期函数与 node_http_parser.cc 进行数据交互。
    想了解更多,请查看http_parser.c文档(https://github.com/nodejs/http-parser)

    image

    3、http_parser.c只有两类回调:HTTP_CB、HTTP_DATA_CB。通过重载的方式,在这两类函数中注册了8个周期函数,如下图:

    image

    4、虽然http_parser注册有8个回调函数,但 node_http_parser.cc 对外只暴露出四个周期函数:

    • parserOnHeaders

    • parserOnHeadersComplete

    • parserOnBody

    • parserOnMessageComplete

    5、当 http_parser.c 解析到 on_headers_complete 时,执行HTTP_CB(on_headers_complete)回调函数,如图:

    image

    函数内会执行 kOnHeadersComplete 回调函数,即:parserOnHeadersComplete 函数(common.js)

    6、此时请求头解析基本完成,接下来创建一个IncomingMessage的实例,然后把请求头数据包装到该实例上。
    执行 onIncoming 回调函数,并把得到的IncomingMessage实例作为参数传递进去。

    image

    7、 在 parserOnIncoming 中,创建一个ServerResponse实例。

    具备了req、res两个实例,接下来触发Server监听的 request 事件。

    在 Server 实例化时的,requestListener是作为函数参数对 request 事件进行监听的。

    image

    8、回到Server创建时:

    image

    综上所述,http_parser 解析完 header 之后,就会触发 request 事件。

    那body数据放到哪里呢,其实body数据会一直放到流里面,直到用户使用data事件接收数据。也就是说,触发request的时候,body并不会被解析。

    3.流程梳理

    完整的http请求是这样的:

    • 客户端发起HTTP请求,首先触发Server端的connection事件,建立TCP链接。

    • Server接收到connection事件后,建立TCP连接,并暴露出套接字,通过套接字监听'data'事件;初始化http-parser,为后续解析数据备用。

    • HTTP请求数据到达Server端,parser执行execute方法进行解析,请求头解析成功后,通过回调触发request事件。

    • 至此,我们在Server回调函数中,就接收到了此次http请求的request

    image

    4.结语

    由于nodejs不少底层库都是C++/C编写的,在阅读、调试的过程中非常不便。我自己在读源码的时候,也只是着重看的JS部分源码。比如,TCP的三次握手、四次挥手,就没深究它的实现细节啦。 以上分析没有涉及到http-body的解析,对于有body的网络请求,实际情况要更加复杂一些,还有一些细节没有完全搞清。等下次总结、分享,我会尽量把漏掉细节都补上。

    阅读的过程中如果有什么问题,欢迎交流。

    相关文章

      网友评论

        本文标题:NODEJS--HTTP实现分析

        本文链接:https://www.haomeiwen.com/subject/hatorftx.html