背景
最近在测试mlflow性能的时候,发现了一个很奇怪的事情,我们知道mlflow是用(Gunicorn)[https://github.com/mlflow/mlflow/blob/master/mlflow/pyfunc/backend.py#L76] 启动服务的,按照道理说Gunicorn会比flask自带的服务性能会好,但是经过测试,恰好相反,而且并发量越大,两者的差别越大
分析
python中我们用的是版本 是flask 1.1.0 gunicorn 19.9.0
就在百思不得其解的时候,必须拿出的源码分析大法,我们现在就来看一下
对于mlflow,如果启动的时候,不指定任何跟Gunicorn 相关的参数的时候,默认的worker个数为1,且threads的个数也是1,且默认的worker-class为syn,也就是同步方式,有关Gunicorn的解释, 可以参考这篇文章,也就是说只有一个worker 同步的工作
而对比flask自带的web服务来说, flask-1.1.0 app.py,也就是说flask 1.1.0 默认情况下,是多线程处理的
options.setdefault("threaded", True)
所以到这里,真相自然就出来了
当然我们在使用mlflow的时候按照以下方式增加worker数目和thread数据
export GUNICORN_CMD_ARGS="-w 4 --threads 2"
关于python GIL,可以参考该文章
网友评论