历史原因,一直使用 libev 作为服务底层;异步框架虽然性能比较高,但新人使用门槛非常高,而且串行的逻辑被打散为状态机,这也会严重影响生产效率。
用同步方式实现异步功能,既保证了异步性能优势,又使得同步方式实现源码思路清晰,容易维护,这是协程的优势。带着这样的目的学习微信开源的一个轻量级网络协程库:libco 。
文章来源: [libco] 协程库学习,测试连接 mysql
1. 概述
libco 是轻量级的协程库,看完下面几个帖子,应该能大致搞懂它的工作原理。
2. 问题
带着问题学习 libco:
- 搞清这几个概念:阻塞,非阻塞,同步,异步,锁。
- 协程是什么东西,与进程和线程有啥关系。
- 协程解决了什么问题。
- 协程在什么场景下使用。
- 协程切换原理。
- 协程切换时机。
- 协程需要上锁吗?
- libco 主要有啥功能。(协程管理,epoll/kevent,hook)
3. libco 源码结构布局
将 libco 的源码结构展开,这样方便理清它的内部结构关系。
4. mysql 测试
- 测试目标:测试 libco 协程性能,以及是否能将 mysqlclient 同步接口进行异步改造。
- 测试系统:CentOS Linux release 7.7.1908 (Core)
- 测试源码:github。
- 测试视频:gdb & libco & mysql
4.1. 测试源码
/* 数据库信息。 */
typedef struct db_s {
std::string host;
int port;
std::string user;
std::string psw;
std::string charset;
} db_t;
/* 协程任务。 */
typedef struct task_s {
int id; /* 任务 id。 */
db_t* db; /* 数据库信息。 */
MYSQL* mysql; /* 数据库实例指针。 */
stCoRoutine_t* co; /* 协程指针。 */
} task_t;
/* 协程处理函数。 */
void* co_handler_mysql_query(void* arg) {
co_enable_hook_sys();
...
/* 同步方式写数据库访问代码。 */
for (i = 0; i < g_co_query_cnt; i++) {
g_cur_test_cnt++;
/* 读数据库 select。 */
query = "select * from mytest.test_async_mysql where id = 1;";
if (mysql_real_query(task->mysql, query, strlen(query))) {
show_error(task->mysql);
return nullptr;
}
res = mysql_store_result(task->mysql);
mysql_free_result(res);
}
...
}
int main(int argc, char** argv) {
...
/* 协程个数。 */
g_co_cnt = atoi(argv[1]);
/* 每个协程 mysql query 次数。 */
g_co_query_cnt = atoi(argv[2]);
/* 数据库信息。 */
db = new db_t{"127.0.0.1", 3306, "root", "123456", "utf8mb4"};
for (i = 0; i < g_co_cnt; i++) {
task = new task_t{i, db, nullptr, nullptr};
/* 创建协程。 */
co_create(&(task->co), NULL, co_handler_mysql_query, task);
/* 唤醒协程。 */
co_resume(task->co);
}
/* 循环处理协程事件逻辑。 */
co_eventloop(co_get_epoll_ct(), 0, 0);
...
}
5. hook
在 Centos 系统,查看 hook 是否成功,除了测试打印日志,其实还有其它比较直观的方法。
5.1. strace
用 strace 查看底层的调用,我们看到 mysql_real_connect
内部的 connect,被 hook 成功,connect 前,被替换为 libco 的 connect 了。socket 在 connect 前,被修改为 O_NONBLOCK
。
# strace -s 512 -o /tmp/libco.log ./test_libco 1 1
socket(AF_INET, SOCK_STREAM, IPPROTO_TCP) = 4
fcntl(4, F_GETFL) = 0x2 (flags O_RDWR)
fcntl(4, F_SETFL, O_RDWR|O_NONBLOCK) = 0
connect(4, {sa_family=AF_INET, sin_port=htons(3306), sin_addr=inet_addr("127.0.0.1")}, 16) = -1 EINPROGRESS (Operation now in progress)
5.2. gdb
上神器 gdb,在 co_hook_sys_call.cpp 文件的 read 和 write 函数下断点。
命中断点,查看函数调用堆栈,libco 在 Centos 系统能成功 hook 住 mysqlclient 的阻塞接口。
#0 read (fd=fd@entry=9, buf=buf@entry=0x71fc30, nbyte=nbyte@entry=19404) at co_hook_sys_call.cpp:299
#1 0x00007ffff762b30a in read (__nbytes=19404, __buf=0x71fc30, __fd=9) at /usr/include/bits/unistd.h:44
#2 my_read (Filedes=Filedes@entry=9, Buffer=Buffer@entry=0x71fc30 "", Count=Count@entry=19404, MyFlags=MyFlags@entry=0)
at /export/home/pb2/build/sb_0-37309218-1576675139.51/rpm/BUILD/mysql-5.7.29/mysql-5.7.29/mysys/my_read.c:64
#3 0x00007ffff7624966 in inline_mysql_file_read (
src_file=0x7ffff78424b0 "/export/home/pb2/build/sb_0-37309218-1576675139.51/rpm/BUILD/mysql-5.7.29/mysql-5.7.29/mysys/charset.c",
src_line=383, flags=0, count=19404, buffer=0x71fc30 "", file=9)
at /export/home/pb2/build/sb_0-37309218-1576675139.51/rpm/BUILD/mysql-5.7.29/mysql-5.7.29/include/mysql/psi/mysql_file.h:1129
#4 my_read_charset_file (loader=loader@entry=0x7ffff7ed7270, filename=filename@entry=0x7ffff7ed7320 "/usr/share/mysql/charsets/Index.xml",
myflags=myflags@entry=0) at /export/home/pb2/build/sb_0-37309218-1576675139.51/rpm/BUILD/mysql-5.7.29/mysql-5.7.29/mysys/charset.c:383
6. 压测结果
从测试结果看,单进程单线程,多个协程是“同时”进行的,“并发”量也随着协程个数增加而增加,跟测试预期一样。
这里只测试协程的"并发性",实际应用应该是用户比较多,每个用户的 sql 命令比较少的。
# ./test_libco 1 10000
id: 0, test cnt: 10000, cur spend time: 1.778823
total cnt: 10000, total time: 1.790962, avg: 5583.591448
# ./test_libco 2 10000
id: 0, test cnt: 10000, cur spend time: 2.328348
id: 1, test cnt: 10000, cur spend time: 2.360431
total cnt: 20000, total time: 2.373994, avg: 8424.620726
# ./test_libco 3 10000
id: 0, test cnt: 10000, cur spend time: 2.283759
id: 2, test cnt: 10000, cur spend time: 2.352147
id: 1, test cnt: 10000, cur spend time: 2.350272
total cnt: 30000, total time: 2.370038, avg: 12658.024719
7. mysql 连接池
用 libco 在项目(co_kimserver)里,简单造了个连接池。Linux 压力测试单进程 10w 个协程,每个协程读 10 个 sql 命令(相当于 100w 个包),并发处理能力 8k/s,在可接受范围内。
详细请参考:《[co_kimserver] libco mysql 连接池》
# ./test_mysql_mgr r 100000 10
total cnt: 1000000, total time: 125.832877, avg: 7947.048692
- 压测源码(github)。
- mysql 连接池 简单实现。
- libco hook 技术虽然将 mysqlclient 阻塞接口设置为非阻塞,但是每个 mysqlclient 连接,必须一次只能处理一个命令,像同步那样!非阻塞只是方便协程切换到其它空闲协程继续工作,充分利用原来阻塞等待的时间。mysqlclient 链接是串行工作,一个连接,一次只能处理一个 sql 命令请求,不可能被你设置为非阻塞后,一次往 mysql server 发 N 个包,这样肯定会出现不可预料的问题。
- libco 协程切换成本不高,主要是 mysqlclient 耗费性能,参考火焰图。
- 压测频繁地申请内存空间也耗费了不少性能(参考火焰图的 __brk),尝试添加 jemalloc 优化,发现 jemalloc 与 libco 一起用在 Linux 竟然出现死锁!!!
火焰图参考:如何生成火焰图🔥
8. 小结
- 通过学习其他大神的帖子,走读源码,写测试代码,终于对协程有了比较清晰的认知。
- 测试 libco,Centos 功能正常,但 MacOS 下不能成功 Hook 住 mysqlclient 阻塞接口。
- libco 是轻量级的,它主要应用于高并发的 IO 密集型场景,所以它绑定了多路复用事件驱动(epoll)。
- 虽然测试效果不错,如果你考虑用 libco 去造一个 mysql 连接池,还有不少工作要做。
- libco 很不错,所以我选择 golang 🐶。
- 然后欢迎大家查看我的 《libco 文章系列》 啦啦啦 🌶。
9. 参考
- 云风 coroutine 协程库源码分析
- 微信 libco 协程库源码分析
- C/C++协程库libco:微信怎样漂亮地完成异步化改造
- 单机千万并发连接实战
- 【腾讯Bugly干货分享】揭秘:微信是如何用libco支撑8亿用户的
- 简述 Libco 的 hook 层技术
- 动态链接黑魔法: Hook 系统函数
- libco 分析(上):协程的实现
- libco 分析(下):协程的管理
- 协程
- Linux进程-线程-协程上下文环境的切换与实现
- 微信开源C++协程库Libco—原理与应用
- 腾讯协程库libco的原理分析
- C++ 协程的近况、设计与实现中的细节和决策
- 漫谈微信libco协程设计及实现(万字长文)
- Android PLT hook 概述
网友评论