Node.js是什么?
Node.js最初开始于2009年,让JavaScript代码离开浏览器的执行环境也可以执行
可以将Node.js理解为一个将多种技术组合起来的平台,可以使用JavaScript调用系统接口,开发后端应用
既然说到将多种技术组合起来,那么可以先看看Node.js用到了哪些技术
node v1.0.png
图片是nodejs v1.0也就是最早发布的node版本下的deps文件,也就是nodejs所用到的依赖
-
cares
:用C-ares
做域名解析 -
gtest
:是C/C++
的单元测试框架 -
http-parser
:用来解析http -
npm
:包管理工具 -
openssl
:用来解析https -
uv
:一个跨平台的异步I/O
库 -
v8
:google开发的js引擎,为js提供运行环境 -
zlib
:用来做加密
那么这些技术又是怎么进行组合的呢,再看看Node.js的技术架构
node技术架构.png将Node.js分成三层
- 首先最上层是node api,提供http模块、流模块、文件模块等等,可以使用js直接调用
- 中间层
node bindings
主要是使js和C/C++进行通信 - 最下面这一层是支撑nodejs运行的关键,主要由
v8
、libuv
、c-ares
等模块组成,向上一层提供api服务
相信我们或多或少都接触过第一层Node api,刚刚也通过Node安装的依赖初步了解了最下层的模块具有什么功能,那么中间的这个Node bindings又是什么呢?
什么是Node bindings?
背景:C/C++实现了一个用来解析http的库
http-parser
,非常高效,可是对于只会写js的程序员非常的不友好,因为没有办法直接去调用这个C/C++
的库,这两个语言连最基本的数据类型都不一样,还怎么做朋友
结论:js无法直接调用C++
的库,需要一个中间的桥梁(调用途径)
那么bindings需要怎么实现呢?
Node.js的作者Ryan做了一个中间层处理
- Node.js用C++对http-parse进行封装,使它符合某些要求(比如统一数据类型),封装好的文件叫做
http_parse_binding.cpp
- 用Node.js提供的编译工具将其编译为
.node
文件 - js代码可以直接通过
require
关键字引入这个.node
文件
这样js就能够调用C++库,这个中间的桥梁就是bindings,由于node提供了很多binding,所以就叫做node bindings
JS如何与C++通信?
// test.js
const addon = require('./build/Release/addon');
console.log('This should be eight:', addon.add(3, 5));
上面是js调用,再来看看C++代码(已被编译)
// addon.cc
#include <node.h>
namespace demo {
using v8::Exception;
using v8::FunctionCallbackInfo;
using v8::Isolate;
using v8::Local;
using v8::NewStringType;
using v8::Number;
using v8::Object;
using v8::String;
using v8::Value;
// 这是 "add" 方法的实现。
// 输入参数使用 const FunctionCallbackInfo<Value>& args 结构传入。
void Add(const FunctionCallbackInfo<Value>& args) {
Isolate* isolate = args.GetIsolate();
// 检查传入的参数的个数。
if (args.Length() < 2) {
// 抛出一个错误并传回到 JavaScript。
isolate->ThrowException(Exception::TypeError(
String::NewFromUtf8(isolate,
"参数的数量错误",
NewStringType::kNormal).ToLocalChecked()));
return;
}
// 检查参数的类型。
if (!args[0]->IsNumber() || !args[1]->IsNumber()) {
isolate->ThrowException(Exception::TypeError(
String::NewFromUtf8(isolate,
"参数错误",
NewStringType::kNormal).ToLocalChecked()));
return;
}
// 执行操作
double value =
args[0].As<Number>()->Value() + args[1].As<Number>()->Value();
Local<Number> num = Number::New(isolate, value);
// 设置返回值 (使用传入的 FunctionCallbackInfo<Value>&)。
args.GetReturnValue().Set(num);
}
void Init(Local<Object> exports) {
NODE_SET_METHOD(exports, "add", Add);
}
NODE_MODULE(NODE
_GYP_MODULE_NAME, Init)
} // 命名空间示例
Nodejs封装的插件开放一些对象和函数,供运行在Node.js中的JS访问,当JS调用函数addon
时,输入参数和返回值与C/C++
代码相互映射,统一封装处理。这样就可以直接在Node.js中引入并使用
// test.js
const addon = require('./build/Release/addon');
// 传入一个函数
addon((msg) => {
console.log(msg);
// 打印: 'hello world'
});
传入C++并执行
// addon.cc
#include <node.h>
namespace demo {
using v8::Context;
using v8::Function;
using v8::FunctionCallbackInfo;
using v8::Isolate;
using v8::Local;
using v8::NewStringType;
using v8::Null;
using v8::Object;
using v8::String;
using v8::Value;
void RunCallback(const FunctionCallbackInfo<Value>& args) {
Isolate* isolate = args.GetIsolate();
Local<Context> context = isolate->GetCurrentContext();
Local<Function> cb = Local<Function>::Cast(args[0]);
const unsigned argc = 1;
// 这里有一个c++方法,将args[0]也就是我们传入的函数,转化成c++看得懂的,用cb接收
Local<Value> argv[argc] = {
String::NewFromUtf8(isolate,
"hello world",
NewStringType::kNormal).ToLocalChecked() };
// 调用一下,传入的函数就被调用了,打印出hello world
cb->Call(context, Null(isolate), argc, argv).ToLocalChecked();
}
void Init(Local<Object> exports, Local<Object> module) {
NODE_SET_METHOD(module, "exports", RunCallback);
}
NODE_MODULE(NODE_GYP_MODULE_NAME, Init)
}
在这个例子中,回调函数被同步地调用,要知道C++是看不懂JS的,所以如何做中间层的封装就交给这些node插件去做
有了这些Node.js提供的插件(node binding),JS和C++就可以进行交互了,也使JS的能力被大大的扩展了
再回顾一下Node.js的技术架构
node技术架构.png刚刚详细介绍了什么是Node bindings,它是如何工作的,接着再来看最下面一层功能模块
下载.png
什么是V8
它是Google开发的js引擎,为js提供运行环境
为啥是v8?它是现阶段执行js最快的一个引擎
那么v8的功能有哪些呢
- 将JS源代码变成本地代码并执行
- 维护调用栈,确保JS函数的执行顺序
- 内存管理,为所有对象分配内存
- 垃圾回收,重复利用无用的内存
- 实现JS的标准库
逐个分析一下:
- 啥是本地代码?其实本地代码就是机器代码,就比如说0和1,计算机看到这些代码直接就可以执行,不再需要借助其他的任何工具,非常的高效。V8在运行之前将js编译成了机器代码
- JS函数的执行顺序是由v8引擎决定的
- 那么v8如何做内存管理呢?比如说
new
一个对象,它的内存在哪里,也是引擎来决定的 - 而垃圾回收,是因为内存是有限的,比如用了2k的内存,用完了还得还回来给下一个程序用,所以目的就是为了重复利用
- 标准库这个怎么理解?其实就是实现数组的
sort
,splice
等等api,v8来实现,js来调用
需要注意的是:js是单线程的,而V8本身是多线程的,开一个线程执行js,开一个线程清理内存,然后再处理一些其他别的活儿,线程和线程之间毫无瓜葛
什么是libuv
背景:因为各个系统的I/O库都不一样,windows系统有IOCP,Linux系统有epoll。Node.js的作者Ryan为了将其整合在一起实现一个跨平台的异步I/O库,开始写libuv
好了,背景说完了,啥是I/O?
例如:
- 从操作系统写文件到硬盘
- 访问网络,从操作系统发出数据到别的服务器
- 打印连接打印机,从操作系统发指令给打印机
以上这些行为都是I/O,可以理解为系统和外界进行交互的过程都叫I/O
而
libuv
会根据你是什么系统,自动的选择当前系统已经实现好了的异步操作(I/O)库,用于TCP/UDP/DNS文件等的异步操作
- 比如操作TCP,我们都知道http是基于TCP/IP的,如果可以操作TCP那么,就可以做http的服务
- UDP,用于实时通信,常见的QQ聊天
- 解析DNS
包括读文件、写文件什么的,libuv都可以帮你管理。这样I/O的部分就全部交给c语言去做,js完全不用管,甩手掌柜,负责调用就行了
v8
和libuv
在整个Node.js架构的底层是最为重要的,其他功能就不做详细介绍了
Node.js工作流程
Node.js工作流程了解了Node Bindings、v8
、还有libuv
貌似可以把工作流程串一串了
Application就是咱们写的代码,把它放在
v8
上面去运行。发现需要去读一个文件,这时候libuv
开一个线程去读文件。读完文件,操作系统会返回一个事件给event loop
,event loop
就把文件传回给v8
,再给到代码
Emmm...
还是先了解一下Event Loop吧
images.jpeg
什么是Event Loop
Event Loop,是Event和Loop
- Event
计时器到期了、文件可以读取了、读取出错了
比如说在js里面写一个setTimeOut,10秒之后打印一行字,所以当10秒钟到了,就会产生一个事件,执行回调
什么时候文件可以读,什么时候文件可以写,或者说读取出错的时候,就需要操作系统生成一个事件(Event)告诉js,因为js啥也不知道
一般来说事件分两种,内部的和外部事件,比如计时器就是内部事件,文件读取就是外部的,因为文件在硬盘上面,硬盘和操作系统又是分开的
- Loop
Loop就是循环,由于事件分优先级,所以处理起来也是分先后顺序,所以Node.js需要按顺序轮询每种事件,轮询是循环的
既然说到事件优先级,举个例子,有三种不同的事件
setTimeout(fn1, 100) // 计时器到期了
fs.readFile(‘/1.txt’, fn2) // 文件可以读了
server.on(‘close’, fn3) // 服务器关闭了
以上三种事件如果同时发生,执行顺序是怎么样的?
- 执行读文件,文件来了立马去读
因为如果文件可以读了现在不读,没准儿过会儿就不能读了 - 执行服务器事件
用户请求进来,可以稍微等一会儿,但是如果太久了也可能就不请求了 - 执行定时器的事件
定时器可以拖一下
这个顺序是人为规定的,接着循环
人为规定了一个优先级也就是一个执行顺序,这个人为规定就是event loop
总结下来就是三句话
- 对不同的事件分优先级
- node.js顺序的去轮询每一种事件
- 把这个过程看成循环圈
示意如图:
图片 4.png
timer:先看看有没有计时器,有了执行
I/O:有咩有其他没有归类的回调
Idle:空闲一会儿,清理战场
Poll:轮询阶段,处理大部分的事件(文件可读了?读!http请求来了,处理!)
Check:处理setImmediate回调
Close callback:看看有没有socket关闭的回调
------------循环-----------------
但是node.js不傻,不会一直循环循环,如果发现没什么事儿做,就会停留在poll(轮询)阶段
轮询的阶段呢,会看看有没有文件可以读,有没有请求可以处理,就等着,时不时的看看有没有新的代码,或者检查一下最近的计时器,看看有没有需要过会儿去执行的callback
如果计时器事件要处理了,我再从下出发,绕回timers
Node.js大部分时间都会停留在poll阶段,大部分事件都在poll阶段被处理,如文件、网络请求
相信大家对Event Loop有了一个初步的了解和认识,那么看回Node.js工作流程
Node.js工作流程- Application就是咱们写的代码,把它放在v8上面去运行
- 运行的过程中,发现我们写了个
setTimeout
,v8
就会调用Node.js的bindings,把这个settimeout
放进Even loop里面 - Event loop就会等待适合的时机去发送一个事件去执行这些js代码,接着循环等待,一般停留在poll阶段久一些
- 发现需要去读一个文件,这时候Event loop就会通过
libuv
开一个线程去专门做读文件这事儿 - 读完文件,操作系统会返回一个事件给Event loop,Event loop就把文件传回给
v8
,最后给到代码
需要注意js从头至尾都不参与读文件这个事情,libuv
去读
(可以看到最最重要的部分是libuv和v8,而我们写的代码只占小小的一部分)
下载 _1_.jpeg一句话就是,代码到
v8
,通过Node api 使用libuv
和其他一些C/C++
提供的功能去完成用户所需要的功能
Nodejs将这些模块进行整合,所以说Node.js不是一门语言,就是一个平台
最后的最后,回顾总结一下
- 用
libuv
进行异步I/O
操作
Node.js是使用libuv
进行异步I/O
操作,一般来说读文件是一个同步的动作,这时候有了libuv
,Nodejs就把这活儿交给了libuv
,让libuv
去读这个文件,这时候Node.js就没有什么事儿可以做了,等libuv
读完了发过来一个事件,Node.js再接手处理,这就是个很重要的异步过程 - 用Event loop管理事件处理顺序
基于libuv
,Nodejs又实现了一个Even loop用来管理不同事件的处理顺序 - 用
C/C++
库高效处理DNS/HTTP
…
Nodejs还使用一些C++
的库,高效的处理了dns/http
等常用功能,有了这些功能,基本上就可以处理文件,处理网络等一些杂七杂八的事情 - 用bindings让JS能和
C/C++
沟通
咱们再如何使用js也使用这些功能呢,这时候bindings的价值就体现出来了,让js能够直接和c++沟通,直接require
一下.node
文件 - 用V8运行JS
接着Nodejs又引入了v8
,让js代码离开浏览器的执行环境也能够运行 - 用Node.js标准库简化JS代码
Node很贴心的给用户准备了很高效的库,比如http
,fs
之类的,大大简化了你的js代码
那么为啥nodejs可以高效的处理这些请求呢?因为直接使用c语言的代码,要比js快
网友评论