美文网首页pythonPython七号
Python 多线程操作学习

Python 多线程操作学习

作者: somenzz | 来源:发表于2018-07-08 22:13 被阅读10次

    Python 多线程操作

    什么是线程:

    线程(Thread)也叫轻量级进程,是操作系统能够进行运算调度的最小单位,它被包涵在进程之中,是进程中的实际运作单位。线程自己不拥有系统资源,只拥有一点儿在运行中必不可少的资源,但它可与同属一个进程的其它线程共享进程所拥有的全部资源。一个线程可以创建和撤消另一个线程,同一进程中的多个线程之间可以并发执行。
    举个简单的例子来理解下:
    假定有一 7 * 24 小时不停工的工厂,由于其电力有限,一次仅供一个车间使用,当一个车间在生产时,其他车间停工。在这里我们可以理解这个工厂相当于操作系统,供电设备相当于 CPU,一个车间相当于一个进程。

    一个车间里,可以有很多工人。他们协同完成一个任务。车间的空间是工人们共享的,这里一个工人就相当于一个线程,一个进程可以包括多个线程。比如许多房间是每个工人都可以进出的。这象征一个进程的内存空间是共享的,每个线程都可以使用这些共享内存。

    有时候资源有限,比如有些房间最多只能容纳一个人,当一个人占用的时候,其他人就不能进去,只能等待。这代表一个线程使用某些共享内存时,其他线程必须等它结束,才能使用这一块内存。

    一个防止他人进入的简单方法,就是门口加一把锁。先到的人锁上门,后到的人看到上锁,就在门口排队,等锁打开再进去。这就叫"互斥锁"(Mutual exclusion,缩写 Mutex ),防止多个线程同时读写某一块内存区域。
    还有些房间,可以同时容纳 n 个人,比如厨房。也就是说,如果人数大于 n,多出来的人只能在外面等着。这好比某些内存区域,只能供给固定数目的线程使用。这时的解决方法,就是在门口挂 n 把钥匙。进去的人就取一把钥匙,出来时再把钥匙挂回原处。后到的人发现钥匙架空了,就知道必须在门口排队等着了。这种做法叫做"信号量"( Semaphore ),用来保证多个线程不会互相冲突。

    不难看出, mutex 是 semaphore 的一种特殊情况(n=1时)。也就是说,完全可以用后者替代前者。但是,因为 mutex 较为简单,且效率高,所以在必须保证资源独占的情况下,还是采用这种设计。

    线程有 就绪、阻塞、运行 三种基本状态。

    1. 就绪状态是指线程具备运行的所有条件,逻辑上可以运行,在等待处理机;
    2. 运行状态是指线程占有处理机正在运行;
    3. 阻塞状态是指线程在等待一个事件(如某个信号量),逻辑上不可执行。

    三种状态的相互转化如下图所示:


    image
    1. multiprocessing

    Python中线程与进程使用的同一模块 multiprocessing。使用方法也基本相同,唯一不同的是,from multiprocessing import Pool 这样导入的 Pool 表示的是进程池,from multiprocessing.dummy import Pool这样导入的 Pool表示的是线程池。这样就可以实现线程里面的并发了。
    线程池实例:

    from multiprocessing.dummy import Pool as ThreadPool
    import time
    
    
    def fun(n):
        time.sleep(2)
    
    
    start = time.time()
    for i in range(5):
        fun(i)
    print("单线程顺序执行耗时:", time.time() - start)
    
    start2 = time.time()
    # 开8个 worker,没有参数时默认是 cpu 的核心数
    pool = ThreadPool(processes=2)
    # 在线程中执行 urllib2.urlopen(url) 并返回执行结果
    results2 = pool.map(fun, range(5))
    pool.close()
    pool.join()
    print("线程池(5)并发执行耗时:", time.time() - start2)
    
    

    上述代码模拟一个耗时 2 秒的任务,比较其顺序执行 5 次和线程池(并发数为 5 )执行的耗时,运行结果如下所示

    单线程顺序执行耗时: 10.002546310424805
    线程池(5)并发执行耗时: 2.023442268371582
    

    显然并发执行效率更高,接近单次执行的时间。

    总结

    Python 多线程适合用在 I/O 密集型任务中。I/O 密集型任务较少时间用在 CPU 计算上,较多时间用在 I/O 上,如文件读写,web 请求,数据库请求 等;而对于计算密集型任务,应该使用多进程。

    相关文章

      网友评论

        本文标题:Python 多线程操作学习

        本文链接:https://www.haomeiwen.com/subject/ipjauftx.html