美文网首页我爱编程
Node.js(javascript)踩的那些坑

Node.js(javascript)踩的那些坑

作者: jsk | 来源:发表于2016-05-15 14:23 被阅读0次

    不定期更新中。
    最近用node来处理几个长链接问题,用来替换php-fpm,php什么都好,就是维持长链接有问题,如果php-fpm被占用的太多,长时间不响应,则会爆出:
    WARNING: [pool www] server reached pm.max_children setting (50), consider raising it
    而Node则擅长维持长链接。

    字符串的 split(separator, limit)函数(其实是javascript语言的坑)

    split函数用来将字符串按照第一个参数separator来分割(可以是字符串或正则表达式),返回分割后的数组,第二个参数limit,用来限制分割后返回的数组数量,这个参数和其他所有已知人类的编程语言都不一样,他并不是用来限定分割次数的,而是,先把字符串全部分割,分割完成后,取前limit个元素。比如把 str字符串变量以空格分割:
    str.split(' ', 2); 相当于 str.split(' ').slice(0,2);
    这简直是我见到过最丑陋的函数!简直可以称为世界之最奇葩!
    因为有很多的场合下,其实只想限定分割次数,比如这样一串字符串:"user-agent: Mozilla/5.0, OS: Mac, Arch: amd64",我只想用正则/:\s+/来分割一次,后面的就别割了。
    先看看人类的编程语言们,怎么处理split限定次数,比如Ruby:

    2.2.2 :032 > "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/, 2)
     => ["user-agent", "Mozilla/5.0, OS: Mac, Arch:  amd64"] 
    

    很好,返回的很正常,后面的确实没有割。
    在看看js返回:

    > "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/, 2)
    [ 'user-agent', 'Mozilla/5.0, OS' ]
    

    马德,OS后面的被吞掉了!
    于是你只能不要后面这个参数,但是还是不行:

    > "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/)
    [ 'user-agent', 'Mozilla/5.0, OS', 'Mac, Arch', 'amd64' ]
    

    这根本不是想要的,如果仅仅是用字符串来分割,可以把后面的join(': ')一下,但对于正则,解决起来就没有这么简单了,抽空写了一个npm split-limit 包,后来发现有人早就写过了:strsplit 功能差不多。

    对象赋值为引用

    js中,传递的对象,除基本类型BooleanStringNumberUndefinedNull外,其他类型都是引用,这个虽然是js的入门课,但在项目中,尤其是Node这种Daemon性质的代码中,不注意的话危害很大。
    看一段样例代码,有一个http请求封装的函数,每次请求前,用全局的g_headers变量来初始化request的headers,然后再根据传递的参数复写headers

    var URL = require('url');
    var g_headers = {
      'Cache-Control': 'no-cache',
      'Accept': '*/*',
      'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:34.0) Gecko/20100101 Firefox/40.0'
    };
    function node_fetch(method, url, param, headers) {
      var options = URL.parse(url);
      options.headers = g_headers; // 问题代码,应该用 for(var k in g_headers) 来挨个初始化
      for(var k in headers){
        options.headers[k] = headers[k];
      }
      // request 代码
    }
    

    这个函数存在非常大的问题,因为将 g_headers 赋值给了 options.headers 时候,是引用,所以对options.headers的任何改变都会改变全局变量 g_headers,调用多次后,g_headers 已经面目全非了。

    Node.js httpServer维持长链接

    Node.js创建一个httpServer非常简单,官方例子:

    const http = require('http');
    
    const hostname = '127.0.0.1';
    const port = 3000;
    
    const server = http.createServer((req, res) => {
      res.statusCode = 200;
      res.setHeader('Content-Type', 'text/plain');
      res.end('Hello World\n');
    });
    
    server.listen(port, hostname, () => {
      console.log(`Server running at http://${hostname}:${port}/`);
    });
    

    但是我测试长链接的时候,基本上在2分钟左右被强制断开了,后来才查询到,官方文档:
    server.timeout
    <Number> Default = 120000 (2 minutes)
    所以需要在维持长链接的http server中增加timeout值:

    server.timeout = 10*60*1000; // 10分钟
    

    Node.js响应中文

    Node.js响应代码中,输出中文会有问题,常见到的代码是这样:

    var headers = {
      'Content-Type': 'text/plain; charset=utf-8',
      'Content-Length': body.length  // 很多样例代码这样写 body.length
    }; 
    res.writeHead(200, headers);
    res.write(body);
    res.end();
    

    这段代码的问题是,js对于unicode、中文字符 length返回的是实实在在的字符个数,而不是存储的字节量,而中文值utf-8中是3个字节存储的,还有emoji表情则是4个字节,但content-length指定的应该是响应内容的字节码数量,所以会造成接收端接收不到完整的响应数据,从而出现乱码。
    解决代码,用 Buffer.byteLength 替换 length

    var headers = {
      'Content-Type': 'text/plain; charset=utf-8',
      'Content-Length': Buffer.byteLength(body, 'utf8')  // 这里不能为 body.length
    }; 
    res.writeHead(200, headers);
    res.write(body);
    res.end();
    

    相关文章

      网友评论

        本文标题:Node.js(javascript)踩的那些坑

        本文链接:https://www.haomeiwen.com/subject/yxjprttx.html