Python 高级5

作者: Cestine | 来源:发表于2018-11-28 03:14 被阅读0次

    多任务-线程、多线程执行、线程注意点、自定义线程、多线程-共享全局变量、互斥锁、死锁

    1. 多任务-线程

    <1>多任务:

    在同一时间内执行多个任务,每个任务可以理解成现实生活中干的每个活。

    单任务: 一个任务执行完成另外一个任务才能执行

    操作系统轮流让各个任务交替执行,任务1执行0.01秒,切换到任务2,任务2执行0.01秒,再切换到任务3,执行0.01秒……这样反复执行下去。表面上看,每个任务都是交替执行的,但是,由于CPU的执行速度实在是太快了,我们感觉就像所有任务都在同时执行一样。

    单核cpu是并发的执行多任务,真正的并行执行多任务只能在多核CPU上实现,但是,由于任务数量远远多于CPU的核心数量,所以,操作系统也会自动把很多任务轮流调度到每个核心上执行。

    <2>线程的概念

    线程就是在程序运行过程中,执行程序代码的一个分支,每个运行的程序至少都有一个线程

    小结

    首先让我们了解一下并发和并行的概念:什么是并发什么是并行,他们的区别是什么?

    举个简单的例子:

    你吃饭吃到一半,电话来了,你一直到吃完了以后才去接,这就说明你不支持并发也不支持并行.

    你吃饭吃到一半,电话来了,你停了下来接了电话,接完后电话以后继续吃饭,这说明你支持并发。 

    你吃饭吃到一半,电话来了,你一边打电话一边吃饭,这说明你支持并行。

        并行与并发的理解

        并发:交替处理多个任务的能力;

        并行:同时处理多个任务的能力;

        并发的关键是你有处理多个任务的能力,不一定要同时。

        并行的关键是你有同时处理多个任务的能力,强调的是同时.

        所以它们最大的区别就是:是否是『同时』处理任务。

        对于一个多核cpu来说并行显然要比并发快的多

        由此我们可以知道一个多核cpu在处理多个任务的时候如果想要发挥最大功效就要实现并行

        那我们在使用多线程和多进程来写程序的时候就是为了让多核cpu发挥他最大的功效实现并行

      并发:指的是任务数多于cpu核数,通过操作系统的各种任务调度算法,实现用多个任务“一起”执行(实际上总有一些任务不在执行,因为切换任务的速度相当快,看上去一起执行而已)

      并行:指的是任务数小于等于cpu核数,即任务真的是一起执行的

    2.多线程执行

    <1>导入线程模块

    #导入线程模块

    import threading

    <2>线程类Thread参数说明

    def __init__(self, group=None, target=None, name=None,args=(), kwargs=None, *, daemon=None):

    Thread([group [, target [, name [, args [, kwargs]]]]])

      group: 线程组,目前只能使用None

      target: 执行的目标任务名

      args: 以元组的方式给执行任务传参

      kwargs: 以字典方式给执行任务传参

      name: 线程名,一般不用设置

      daemon= True 守护主线程

    <3>启动线程

    启动线程使用start方法

    <4>多线程完成多任务的代码

    #导入线程模块

    import threading

    import time

    # 唱歌任务

    def sing():

        # 扩展: 获取当前线程threading.current_thread()

        # print("sing当前执行的线程为:", threading.current_thread())

        for i in range(3):

            print("正在唱歌...%d" % i)

            time.sleep(1)

    # 跳舞任务

    def dance():

        # 扩展: 获取当前线程

        # print("dance当前执行的线程为:", threading.current_thread())

        for i in range(3):

            print("正在跳舞...%d" % i)

            time.sleep(1)

    if __name__ == '__main__':

        # 扩展: 获取当前线程

        # print("当前执行的线程为:", threading.current_thread())

        # 创建唱歌的线程

        # target: 线程执行的函数名、方法名

        sing_thread = threading.Thread(target=sing)

        # 创建跳舞的线程

        dance_thread = threading.Thread(target=dance)

        # 开启线程, 必须启动线程才能执行任务

        sing_thread.start()

        dance_thread.start()

    <6>多线程执行带有参数的任务

    import threading

    import time

    # 唱歌任务

    def sing(num):

        # 扩展: 获取当前线程

        # print("sing当前执行的线程为:", threading.current_thread())

        for i in range(num):

            print("正在唱歌...%d" % i)

            time.sleep(1)

    # 跳舞任务

    def dance(num):

        # 扩展: 获取当前线程

        # print("dance当前执行的线程为:", threading.current_thread())

        for i in range(num):

            print("正在跳舞...%d" % i)

            time.sleep(1)

    if __name__ == '__main__':

        # 扩展: 获取当前线程

        # print("当前执行的线程为:", threading.current_thread())

        # target: 线程执行的函数名

        # args: 表示以元组的方式给函数传参

        # kwargs: 表示以字典的方式给函数传参

        sing_thread = threading.Thread(target=sing, args=(3, ))

    # 创建跳舞的线程

        dance_thread = threading.Thread(target=dance, kwargs={"num": 3})

    # 开启线程

        sing_thread.start()

        dance_thread.start()

    <7>查看获取线程列表

    获取当前程序活动线程的列表

    thread_list = threading.enumerate()

    活动线程的个数

    num = threading.active_count()

    import threading

    import time

    # 唱歌

    def sing():

        # 扩展:-获取当前执行代码的线程

        print("sing:", threading.current_thread())

        for i in range(5):

            print("唱歌")

            time.sleep(0.2)

    # 跳舞

    def dance():

        # 扩展:-获取当前执行代码的线程

        print("dance:", threading.current_thread())

        for i in range(5):

            print("跳舞")

            time.sleep(0.2)

    if __name__ == '__main__':

        # 扩展:-获取当前执行代码的线程

        print("main:", threading.current_thread())

        # 获取当前程序活动线程的列表

        thread_list = threading.enumerate()

        print("111:", thread_list, len(thread_list))

        # 创建唱歌线程, 表示创建的子线程执行唱歌任务

        sing_thread = threading.Thread(target=sing)

        # 创建跳舞的线程, 表示创建的子线程执行跳舞任务

        dance_thread = threading.Thread(target=dance)

        thread_list = threading.enumerate()

        print("222:", thread_list, len(thread_list))

        # 启动线程,执行对应的任务

        sing_thread.start()

        # 启动线程,执行对应的任务

        dance_thread.start()

        提示:只有线程启动了,才能加入到活动线程列表中

        thread_list = threading.enumerate()

        print("333:", thread_list, len(thread_list))

    总结

      使用多线程可以完成多任务。

      只有线程启动,线程才会加入到活动线程列表

    3.线程注意点

    <1>线程之间执行是无序的

      总结: 线程之间执行是无序的,是由cpu调度决定的

    <2>主线程会等待所有的子线程结束后才结束

      总结: 主线程会等待所有的子线程执行完成以后程序再退出

    <3>守护主线程

        # daemon=True 守护主线程

        # 守护主线程方式1

        sub_thread = threading.Thread(target=show_info, daemon=True)

        # 设置成为守护主线程,主线程退出后子线程直接销毁不再执行子线程的代码

        # 守护主线程方式2

        # sub_thread.setDaemon(True)

        sub_thread.start()

    总结:

      线程之间执行时无序的。

      主线程会等待所有的子线程结束后才结束,如果需要可以设置守护主线程

    4.自定义线程

    <1>自定义线程代码

    import threading

    # 自定义线程类

    class MyThread(threading.Thread):

        # 通过构造方法取接收任务的参数

        def __init__(self, info1, info2):

            # 调用父类的构造方法

            super(MyThread, self).__init__()

            self.info1 = info1

            self.info2 = info2

        # 定义自定义线程相关的任务

        def test1(self):

            print(self.info1)

        def test2(self):

            print(self.info2)

        # 通过run方法执行相关任务,重写父类run方法

        def run(self):

            self.test1()

            self.test2()

    # 创建自定义线程

    my_thread = MyThread("测试1", "测试2")

    # 启动

    my_thread.start()

    注意:

    不要使用custom_thread.run()的方式启动线程,线程启动统一start方法

    custom_thread.run()的任务是在主线程执行的,不是在子线程执行

    start 方法内部会调用run方法

    <2>小结

      自定义线程不能指定target,因为自定义线程里面的任务都统一在run方法里面执行

      启动线程统一调用start方法,不要直接调用run方法, 因为这样不是使用子线程去执行任务

    5.多线程-共享全局变量

      多线程共享全局变量,很方便在多个线程间共享数据

      多线程同时操作全局变量导致数据可能出现错误(可能出现资源竞争,数据错乱的问题)

    全局变量数据错误的解决办法:

    线程同步: 保证同一时刻只能有一个线程去操作全局变量 同步: 就是协同步调,按预定的先后次序进行运行。一个任务执行完成以后另外一个任务才能执行,同一个时刻只有一个任务在执行

    线程同步的方式:

      线程等待(join)也称为线程同步

    主线程等待添加数据线程执行完成以后再执行后面的代码

    add_thread.join()

      互斥锁也称为同步锁

    结论

      多个线程同时对同一个全局变量进行操作,会有可能出现资源竞争数据错误的问题

      线程同步方式可以解决资源竞争数据错误问题,但是这样有多任务变成了单任务。执行效率下降了,数据安全了

    6.互斥锁

    <1>互斥锁的概念

    互斥锁: 对共享数据进行锁定,保证同一时刻只能有一个线程去操作。

    注意:

          抢到锁的线程先执行,没有抢到锁的线程需要等待,等锁用完后需要释放,然后其它等待的线程再去抢这个锁,那个线程抢到那个线程再执行。

          具体哪个线程抢到这个锁我们决定不了,是由cpu调度决定的。

          加上互斥锁多任务瞬间变成单任务,性能会下降,也就是说同一时刻只能有一个线程去执行

    互斥锁为资源引入一个状态:锁定/非锁定

    某个线程要更改共享数据时,先将其锁定,此时资源的状态为“锁定”,其他线程不能更改;直到该线程释放资源,将资源的状态变成“非锁定”,其他的线程才能再次锁定该资源。互斥锁保证了每次只有一个线程进行写入操作,从而保证了多线程情况下数据的正确性。

    threading模块中定义了Lock变量,这个变量本质上是一个函数,可以方便的处理锁定:

    # 创建锁

    mutex = threading.Lock()

    # 锁定

    mutex.acquire()

    # 释放

    mutex.release()

    注意:

      如果这个锁之前是没有上锁的,那么acquire不会堵塞

      如果在调用acquire对这个锁上锁之前 它已经被 其他线程上了锁,那么此时acquire会堵塞,直到这个锁被解锁为止

    <2>使用互斥锁的目的

    能够保证多个线程访问共享数据不会出现资源竞争及数据错误

    <3>上锁、解锁过程

    当一个线程调用锁的acquire()方法获得锁时,锁就进入“locked”状态。

    每次只有一个线程可以获得锁。如果此时另一个线程试图获得这个锁,该线程就会变为“blocked”状态,称为“阻塞”,直到拥有锁的线程调用锁的release()方法释放锁之后,锁进入“unlocked”状态。

    线程调度程序从处于同步阻塞状态的线程中选择一个来获得锁,并使得该线程进入运行(running)状态。

    总结:

    锁的好处:

      确保了某段关键代码只能由一个线程从头到尾完整地执行

    锁的坏处:

      多线程执行变成了包含锁的某段代码实际上只能以单线程模式执行,效率就大大地下降了

      锁使用不好就容易出现死锁情况

    7.死锁

      死锁的概念

    一直等待对方释放锁的情景就是死锁

      死锁一旦发生就会造成应用的停止响应

      避免死锁:在合适的地方释放锁

    小结

      使用互斥锁的时候需要注意死锁的问题,要在合适的地方注意释放锁

      死锁一旦发生就会造成应用的停止响应

    相关文章

      网友评论

        本文标题:Python 高级5

        本文链接:https://www.haomeiwen.com/subject/kgpoqqtx.html