Node.js(javascript)踩的那些坑

作者: jsk | 来源:发表于2016-05-15 14:23 被阅读0次

不定期更新中。
最近用node来处理几个长链接问题，用来替换php-fpm，php什么都好，就是维持长链接有问题，如果php-fpm被占用的太多，长时间不响应，则会爆出：
WARNING: [pool www] server reached pm.max_children setting (50), consider raising it
而Node则擅长维持长链接。

字符串的 `split(separator, limit)`函数（其实是`javascript`语言的坑）

split函数用来将字符串按照第一个参数separator来分割（可以是字符串或正则表达式），返回分割后的数组，第二个参数limit，用来限制分割后返回的数组数量，这个参数和其他所有已知人类的编程语言都不一样，他并不是用来限定分割次数的，而是，先把字符串全部分割，分割完成后，取前limit个元素。比如把 str字符串变量以空格分割：
str.split(' ', 2); 相当于 str.split(' ').slice(0,2);
这简直是我见到过最丑陋的函数！简直可以称为世界之最奇葩！
因为有很多的场合下，其实只想限定分割次数，比如这样一串字符串："user-agent: Mozilla/5.0, OS: Mac, Arch: amd64"，我只想用正则/:\s+/来分割一次，后面的就别割了。
先看看人类的编程语言们，怎么处理split限定次数，比如Ruby：

2.2.2 :032 > "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/, 2)
 => ["user-agent", "Mozilla/5.0, OS: Mac, Arch:  amd64"]

很好，返回的很正常，后面的确实没有割。
在看看js返回：

> "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/, 2)
[ 'user-agent', 'Mozilla/5.0, OS' ]

马德，OS后面的被吞掉了！
于是你只能不要后面这个参数，但是还是不行：

> "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/)
[ 'user-agent', 'Mozilla/5.0, OS', 'Mac, Arch', 'amd64' ]

这根本不是想要的，如果仅仅是用字符串来分割，可以把后面的join(': ')一下，但对于正则，解决起来就没有这么简单了，抽空写了一个npm split-limit 包，后来发现有人早就写过了：strsplit 功能差不多。

对象赋值为引用

js中，传递的对象，除基本类型Boolean、String、Number、Undefined、Null外，其他类型都是引用，这个虽然是js的入门课，但在项目中，尤其是Node这种Daemon性质的代码中，不注意的话危害很大。
看一段样例代码，有一个http请求封装的函数，每次请求前，用全局的g_headers变量来初始化request的headers，然后再根据传递的参数复写headers

var URL = require('url');
var g_headers = {
  'Cache-Control': 'no-cache',
  'Accept': '*/*',
  'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:34.0) Gecko/20100101 Firefox/40.0'
};
function node_fetch(method, url, param, headers) {
  var options = URL.parse(url);
  options.headers = g_headers; // 问题代码，应该用 for(var k in g_headers) 来挨个初始化
  for(var k in headers){
    options.headers[k] = headers[k];
  }
  // request 代码
}

这个函数存在非常大的问题，因为将 g_headers 赋值给了 options.headers 时候，是引用，所以对options.headers的任何改变都会改变全局变量 g_headers，调用多次后，g_headers 已经面目全非了。

Node.js httpServer维持长链接

Node.js创建一个httpServer非常简单，官方例子：

const http = require('http');

const hostname = '127.0.0.1';
const port = 3000;

const server = http.createServer((req, res) => {
  res.statusCode = 200;
  res.setHeader('Content-Type', 'text/plain');
  res.end('Hello World\n');
});

server.listen(port, hostname, () => {
  console.log(`Server running at http://${hostname}:${port}/`);
});

但是我测试长链接的时候，基本上在2分钟左右被强制断开了，后来才查询到，官方文档：
server.timeout
<Number> Default = 120000 (2 minutes)
所以需要在维持长链接的http server中增加timeout值：

server.timeout = 10*60*1000; // 10分钟

Node.js响应中文

Node.js响应代码中，输出中文会有问题，常见到的代码是这样：

var headers = {
  'Content-Type': 'text/plain; charset=utf-8',
  'Content-Length': body.length  // 很多样例代码这样写 body.length
}; 
res.writeHead(200, headers);
res.write(body);
res.end();

这段代码的问题是，js对于unicode、中文字符 length返回的是实实在在的字符个数，而不是存储的字节量，而中文值utf-8中是3个字节存储的，还有emoji表情则是4个字节，但content-length指定的应该是响应内容的字节码数量，所以会造成接收端接收不到完整的响应数据，从而出现乱码。
解决代码，用 Buffer.byteLength 替换 length：

var headers = {
  'Content-Type': 'text/plain; charset=utf-8',
  'Content-Length': Buffer.byteLength(body, 'utf8')  // 这里不能为 body.length
}; 
res.writeHead(200, headers);
res.write(body);
res.end();

网友评论

我爱编程

本文标题：Node.js(javascript)踩的那些坑

本文链接：https://www.haomeiwen.com/subject/yxjprttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Node.js(javascript)踩的那些坑

字符串的 `split(separator, limit)`函数（其实是`javascript`语言的坑）

对象赋值为引用

Node.js httpServer维持长链接

Node.js响应中文

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

我爱编程

Node.js(javascript)踩的那些坑

字符串的 split(separator, limit)函数（其实是javascript语言的坑）

对象赋值为引用

Node.js httpServer维持长链接

Node.js响应中文

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

我爱编程

字符串的 `split(separator, limit)`函数（其实是`javascript`语言的坑）