美文网首页python的那些坑
python 多线程,线程池的使用。

python 多线程,线程池的使用。

作者: Ziger丶 | 来源:发表于2019-04-10 16:50 被阅读0次

    背景:近期工作需要,要缩短多个程序的运行时间。
    目标:做到同时运行多个函数,提高效率。
    方案:查阅资料后,发现可以使用线程,进程,协程来提高效率。(包括线程池,进程池)


    【一】 多线程

    参考原文


    【二】 线程池

    tips:
    #需要处理列表中的所有数据
    url_list =[url1,ulr2,-----,url100]
    

    工作中需要对一个列表中的所有数据进行处理,直接用多线程的话,一开始数据数对不上,后来拆分成多个列表进行处理的话,感觉很麻烦。所以开始使用线程池。
    参考原文

    1、下载运行包
    pip install threadpool 
    
    2、参数说明
    pool = ThreadPool(poolsize)
    

    定义了一个线程池,表示最多可以创建poolsize这么多线程;

    requests = makeRequests(some_callable, list_of_args, callback)
    

    调用makeRequests创建了要开启多线程的函数,以及函数相关参数和回调函数,其中回调函数可以不写,default是无,也就是说makeRequests只需要2个参数就可以运行;

    for req in requests:  
        pool.putRequest(req) 
    

    是将所有要运行多线程的请求扔进线程池;

    pool.wait() 
    

    第四行是等待所有的线程完成工作后退出

    3、对比效果
    #创建一个长度30的列表
    a = []
    n =1 
    while n<=30:
        a.append(n)
        n +=1
    
    #创建一个存储位置
    c = []
    
    #定义一个对单一数据处理的函数,将处理后的数据存储在c中
    def x(aaa):
        u = (12+aaa)+aaa%2
        c.append(u)
        print ("Hello ",aaa)    
        time.sleep(1)
    

    串行操作:

    start_time = time.time()
    for i in a:
        x(i)
    print(c)
    print ('%d second'% (time.time()-start_time))
    

    串行结果


    运行时间
    结果

    线程池操作:

    start_time = time.time()
    #一次跑10个线程
    pool = threadpool.ThreadPool(10) 
    #运行函数x,参数为a
    requests = threadpool.makeRequests(x, a) 
    [pool.putRequest(req) for req in requests] 
    pool.wait() 
    print ('%d second'% (time.time()-start_time))
    

    线程池结果


    运行时间
    结果

    运用线程池可以批量处理数据,节省时间

    4、多个参数的设置。

    实际工作中定义的函数不止包含一个参数,那么在调用线程池的时候需要对参数做预处理。

    if __name__ == '__main__':
         
       # 方法1  --- 存入列表 
        lst_vars_1 = ['1', '2', '3']
        lst_vars_2 = ['4', '5', '6']
        func_var = [(lst_vars_1, None), (lst_vars_2, None)]
        
        # 方法2  --- 存成字典
        dict_vars_1 = {'m':'1', 'n':'2', 'o':'3'}
        dict_vars_2 = {'m':'4', 'n':'5', 'o':'6'}
        func_var = [(None, dict_vars_1), (None, dict_vars_2)]    
         
        pool = threadpool.ThreadPool(2)
        requests = threadpool.makeRequests(hello, func_var)
        [pool.putRequest(req) for req in requests]
        pool.wait()
    

    参数处理:

    list1 = [1,2,3,4,5,6]
    list2 = [7,6,5,4,3,2]
    
    def  X(a,b,c=3,d=4,e=5):
        time.sleep(1)
        print(a+b+c+d+e)
    
    #构建参数组
    data1 =[ {
            'a':i,
            'b':j,
            'c':3,
            'd':4
             } for i,j in zip(list1,list2) ]
    
    data2 = [(None,i) for i in data1]
    
    #调用线程池
    start_time = time.time()
    pool = threadpool.ThreadPool(2)
    requests = threadpool.makeRequests(X, data2)
    [pool.putRequest(req) for req in requests]
    pool.wait()
    print ('%d second'% (time.time()-start_time))
    
    5、编写线程池函数。

    实际工作中可以将线程池编写如函数直接进行调用。
    参数包含(函数,运行所需的参数,线程数量)

    def Run_threadpool (function,data,number):
        pool = threadpool.ThreadPool(number)
        requests = threadpool.makeRequests(function, data)
        [pool.putRequest(req) for req in requests]
        pool.wait()  
    
    6、异常can’t start new thread

    我在跑某个程序时,创建线程池到一个方法中,这个方法会被循环调用,即使局部变量pool被覆盖,但是之前创建的线程依然存在,所以线程炸了

    pool = threadpool.ThreadPool(10)
    把上面的代码放进class的构造函数中,或者保证它只执行一次

    python中线程的正确用法是,按需创建线程,重复使用有限的线程

    相关文章

      网友评论

        本文标题:python 多线程,线程池的使用。

        本文链接:https://www.haomeiwen.com/subject/qrcoiqtx.html