TCP与UDP都属于网络传输层协议,如果构造高效的网络应用,就应该从传输层进行着手。
但是对于经典的应用层协议对于普通应用而言绰绰有余。Node提供了基本的http和https模块用于HTTP和HTTPS的封装,对于其他应用层协议的封装,也能从社区中轻松找到实现:
var http = require('http');
http.createServer(function (req, res) {
res.writeHead(200, { 'Content-Type': 'text/plain' });
res.end('hello world')
}).listen(1337, '127.0.0.1');
console.log('Server running at http://127.0.0.1:1337/');
上面的HTTP服务非常简单,但是他能维持的并发量和QPS都是不容小觑的。
1. 什么是HTTP
HTTP
的全称是超文本传输协议,它构建在TCP
之上,属于应用层协议。在HTTP
的两端是服务器和浏览器,即著名的B/S
模式,Web
即是HTTP
的应用。
2. HTTP报文
我们先采用curl(window,mac中自带的命令行工具
)工具来获取报文。
>curl -v http://127.0.0.1:1337
* Rebuilt URL to: http://127.0.0.1:1337/
* Trying 127.0.0.1...
* TCP_NODELAY set
* Connected to 127.0.0.1 (127.0.0.1) port 1337 (#0)
> GET / HTTP/1.1
> Host: 127.0.0.1:1337
> User-Agent: curl/7.55.1
> Accept: */*
>
< HTTP/1.1 200 OK
< Content-Type: text/plain
< Date: Mon, 24 Feb 2020 23:40:18 GMT
< Connection: keep-alive
< Transfer-Encoding: chunked
<
hello world* Connection #0 to host 127.0.0.1 left intact
上述信息中我门可以看到这次网络通信的报文信息分为几个部分:
第一部分内容为经典的TCP的3次握手过程
* Rebuilt URL to: http://127.0.0.1:1337/
* Trying 127.0.0.1...
* TCP_NODELAY set
* Connected to 127.0.0.1 (127.0.0.1) port 1337 (#0)
第二部分是完成握手之后,客户端向服务器端发送请求报文:
> GET / HTTP/1.1
> Host: 127.0.0.1:1337
> User-Agent: curl/7.55.1
> Accept: */*
第三部分是服务端完成处理后,想客户端发送响应内容,包括响应头和响应体:
< HTTP/1.1 200 OK
< Content-Type: text/plain
< Date: Mon, 24 Feb 2020 23:40:18 GMT
< Connection: keep-alive
< Transfer-Encoding: chunked
第四部分是结束会话信息
Connection #0 to host 127.0.0.1 left intact
http特点
基于响应式,以一问一答的方式实现服务,虽然基于TCP会话,但是本身缺并无会话特点。
HTTP只做两件事:客户端处理HTTP请求,和服务端发送HTTP响应。
从协议的角度来说,很多应用中,比如浏览器,其实是一个http的代理,用户的行为将会通过它转化为HTTP请求报文发送给服务器端,服务器端在处理请求后,发送响应报文给代理,代理在解析报文后,将用户需要的内容呈现在界面上。
无论是HTTP请报文求还是HTTP响应报文,报文内容都是包括两个部分:报文头,报文体。
3. 请求报文
请求报文请求行是由 请求方法、url字段、HTTP协议版本字段三个部分组成,它们用空格分开。
HTTP
协议的请求方法有GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT
。
(1)请求头部
请求头部由键值对组成,关键字和值之间用 : 分开。请求头封装了有关客户端请求的信息,典型的请求头有:
请求头 | 含义 |
---|---|
User-Agent | 产生请求的浏览器类型,User-Agent请求报头域允许客户端将它的操作系统、浏览器和其它属性告诉服务器 |
Accept | 客户端可识别的响应内容类型列表。eg:Accept:image/gif,表明客户端希望接受GIF图象格式的资源;Accept:text/html,表明客户端希望接受html文本。 |
Accept-Language | 客户端可接受的自然语言 |
Accept-chartset | 客户端可接受应答的字符集。eg:Accept-Charset:iso-8859-1,gb2312.如果在请求消息中没有设置这个域,缺省是任何字符集都可以接受。 |
Accept-Encoding | 客户端可接受的编码压缩格式 |
HOST | 请求的主机名称,允许多个域名同处一个IP之地,即虚拟主机 |
Connection | 连接方式(close或keep-alive) |
Cookie | 存储于客户端扩展字段,向同一域名的服务端发送该域的cookie |
Authorization | Authorization请求报头域主要用于证明客户端有权查看某个资源。当浏览器访问一个页面时,如果收到服务器的响应代码为401(未授权),可以发送一个包含Authorization请求报头域的请求,要求服务器对其进行验证。 |
空行
最后一个请求头之后是一个空行,发送回车符和换行符,通知服务器以下不会再有请求头。
(2)请求数据
请求数据不再GET方法中使用,而是在POST方法中使用。POST方法适用于客户端提交表单。与请求数据相关的最常使用的请求头是包体类型 Content-Type 和包体长度 Content-Length;
4. 响应报文
响应报文(1)状态码
状态码有三位数字组成,第一位定义了响应的类别,可能有五种取值:
-
1xx:
表示服务端已经接收到客户端请求,客户端可以继续发送请求; -
2xx:
表示服务端已经成功接收请求并处理; -
3xx:
表示服务器要求客户端重定向; -
4xx:
客户端请求有问题; -
5xx:
服务端未能正常处理客户端的请求出现错误;
常见状态码描述文本有如下:
-
200 OK:
请求成功; -
400 Bad Request:
客户端请求语法有问题,不能被服务端理解; -
401 Unauthorized:
请求未经授权,必须与Authorization请求报头域一起使用(eg:BASE64用户身份验证); -
403 Forbidden:
服务器收到请求但是拒绝提供服务,通常会在响应正文中给出不提供服务的原因; -
404 Not Found:
请求的资源不存在,eg,输错了URL; -
500 Internal Server Error:
服务器发生错误,无法完成客户端请求; -
503 Service Unavailable:
表示服务器当前不能处理客户端请求,一段时间之后可能恢复正常;
(2)响应头
响应头可能包括以下信息:
响应头 | 描述 |
---|---|
Server | Server 响应报头域包含了服务器用来处理请求的软件信息及其版本。它和 User-Agent 请求报头域是相对应的,前者发送服务器端软件的信息,后者发送客户端软件(浏览器)和操作系统的信息。 |
Vary | 指示不可缓存的请求头列表 |
Connection | 连接方式 |
www-Authenticate | WWW-Authenticate响应报头域必须被包含在401 (未授权的)响应消息中,这个报头域和前面讲到的Authorization 请求报头域是相关的,当客户端收到 401 响应消息,就要决定是否请求服务器对其进行验证。如果要求服务器对其进行验证,就可以发送一个包含了Authorization 报头域的请求 |
(3)响应包体
服务器返回给客户端的文本信息
网友评论