Python网络编程 —— 线程

作者: techLee | 来源:发表于2018-06-22 22:47 被阅读15次

个人独立博客：www.limiao.tech
微信公众号：TechBoard

线程的概念

线程就是在程序运行过程中，执行程序代码的一个分支，每个运行的程序至少都有一个线程

单线程执行

import time


def sing():
    for i in range(3):
        print("唱歌...%d" % i)
        time.sleep(1)

def dance():
    for i in range(3):
        print("跳舞...%d" % i)
        time.sleep(1)

if __name__ == '__main__':
    sing()
    dance()

运行结果：

唱歌...0
唱歌...1
唱歌...2
跳舞...0
跳舞...1
跳舞...2

***Repl Closed***

多线程执行

多线程的执行需要导入threading模块

参数说明：

Thread([group[,target[,name[,args[,kwargs]]]]])
- group: 线程组，目前只能使用None
- target: 执行的目标任务名
- args: 以元组的方式给执行任务传参
- kwargs: 以字典方式给执行任务传参
- name: 线程名，一般不用设置

多线程完成多任务

# 多线程执行
import time, threading


def sing():
    # 获取当前进程
    print(threading.current_thread())
    for i in range(3):
        
        print("唱歌...%d" % i)
        time.sleep(1)

def dance():
    print(threading.current_thread())
    for i in range(3):

        print("跳舞...%d" % i)
        time.sleep(1)

if __name__ == '__main__':
    sing_thread = threading.Thread(target=sing)
    dance_thread = threading.Thread(target=dance)

    sing_thread.start()
    dance_thread.start()

运行结果：

<Thread(Thread-1, started 8520)>
唱歌...0
<Thread(Thread-2, started 4604)>
跳舞...0
唱歌...1
跳舞...1
唱歌...2
跳舞...2

***Repl Closed***

多线程执行带有参数的任务

import time, threading


def sing(num):
    for i in range(num):
        print("唱歌...%d" % i)
        time.sleep(1)


def dance(num):
    for i in range(num):
        print("跳舞...%d" % i)
        time.sleep(1)


if __name__ == '__main__':
    sing_thread = threading.Thread(target=sing, args=(3,))

    dance_thread = threading.Thread(target=dance, kwargs={"num": 3})

    sing_thread.start()
    dance_thread.start()

运行结果：

唱歌...0
跳舞...0
跳舞...1
唱歌...1
跳舞...2
唱歌...2

***Repl Closed***

查看获取线程列表

import time, threading


def sing():
    for i in range(5):
        print("唱歌...%d" % i)
        time.sleep(1)


def dance():
    for i in range(5):
        print("跳舞...%d" % i)
        time.sleep(1)


if __name__ == '__main__':
    # 获取当前程序活动线程的列表
    thread_list = threading.enumerate()
    print("111:", thread_list, len(thread_list))

    sing_thread = threading.Thread(target=sing)

    dance_thread = threading.Thread(target=dance)

    thread_list = threading.enumerate()
    print("222:", thread_list, len(thread_list))

    # 启动线程
    sing_thread.start()
    dance_thread.start()

    # 只有线程启动了，才能加入到活动线程列表中
    thread_list = threading.enumerate()
    print("333:", thread_list, len(thread_list))

运行结果：

111: [<_MainThread(MainThread, started 11864)>] 1
222: [<_MainThread(MainThread, started 11864)>] 1
唱歌...0
跳舞...0
333: [<_MainThread(MainThread, started 11864)>, <Thread(Thread-1, started 892)>, <Thread(Thread-2, started 6444)>] 3
跳舞...1
唱歌...1
跳舞...2
唱歌...2
唱歌...3
跳舞...3
唱歌...4
跳舞...4

***Repl Closed***

注意

线程之间执行是无序的

import time, threading


def task():
    time.sleep(1)
    print("当前线程：", threading.current_thread().name)

if __name__ == '__main__':

    for _ in range(5):
        sub_thread = threading.Thread(target=task)
        sub_thread.start()

运行结果：

当前线程： Thread-5
当前线程： Thread-2
当前线程： Thread-3
当前线程： Thread-1
当前线程： Thread-4

***Repl Closed***

主线程会等待所有的子线程结束后才结束

# 主线程会等待所有的子线程结束后才会结束
import time, threading


# 测试主线程是否会等待子线程执行完成以后程序再退出
def show_info():
    for i in range(5):
        print("test:", i)
        time.sleep(1)


if __name__ == '__main__':
    sub_thread = threading.Thread(target=show_info)
    sub_thread.start()

    # 主线程延时5秒
    time.sleep(10)
    print("over")

运行结果：

test: 0
test: 1
test: 2
test: 3
test: 4
over

***Repl Closed***

守护主线程

import time, threading


def show_info():
    for i in range(5):
        print("test：", i)
        time.sleep(1)

if __name__ == '__main__':
    # 设置成守护主线程，主线程退出后子线程直接销毁不再执行子线程的代码
    sub_thread = threading.Thread(target=show_info, daemon=True)
    

    sub_thread.start()
    
    time.sleep(10)
    print("over")

运行结果：

test： 0
test： 1
test： 2
test： 3
test： 4
over

***Repl Closed***

自定义线程

import threading


# 自定义线程类
class MyThread(threading.Thread):
    # 通过构造方法取接受任务的参数
    def __init__(self, info1, info2):
        # 调用父类的构造方法
        super().__init__()
        self.info1 = info1
        self.info2 = info2


    # 定义自定义线程相关的任务
    def test1(self):
        print(self.info1)


    def test2(self):
        print(self.info2)

    # 通过run方法执行相关任务
    def run(self):
        self.test1()
        self.test2()


# 创建自定义线程
my_thread = MyThread("测试1", "测试2")

# 启动
my_thread.start()

运行结果：

测试1
测试2

***Repl Closed***

总结：

自定义线程不能指定target，因为自定义线程里面的任务都统一在run方法里面执行
启动线程统一调用start方法，不要直接调用run方法，因为这样不是使用子线程去执行任务

多线程共享全局变量

import time, threading


# 定义全局变量
my_list = list()

# 写入数据任务
def write_data():
    for i in range(5):
        my_list.append(i)
        time.sleep(1)
    print("write_data:", my_list)

# 读取数据任务
def read_data():
    print("read_data:", my_list)

if __name__ == '__main__':
    # 创建写入数据的线程
    write_thread = threading.Thread(target=write_data)
    # 创建读取数据的线程
    read_thread = threading.Thread(target=read_data)

    write_thread.start()

    # 主线程等待写入线程执行完成以后代码再继续往下执行
    write_thread.join()
    print("开始读取数据...")
    read_thread.start()

运行结果：

write_data: [0, 1, 2, 3, 4]
开始读取数据...
read_data: [0, 1, 2, 3, 4]

***Repl Closed***

多线程同时对全局变量进行操作,导致数据可能出现错误

import threading


# 定义全局变量
g_num = 0

# 循环一次给全局变量加1
def sum_num1():
    for i in range(1000000):
        global g_num
        g_num += 1
    print("sum1:", g_num)

# 循环一次给全局变量加1
def sum_num2():
    for i in range(1000000):
        global g_num
        g_num += 1
    print("sum2:", g_num)

if __name__ == '__main__':
    # 创建两个线程
    first_thread = threading.Thread(target=sum_num1)
    second_thread = threading.Thread(target=sum_num2)

    first_thread.start()
    second_thread.start()

运行结果：

sum1: 1491056
sum2: 1528560

***Repl Closed***

通过上面运行结果，得出：多线程同时对全局变量操作数据发生了错误

原因分析：两个线程first_thread和second_thread都要对全局变量g_num(默认是0)进行加1运算，但是由于是多线程同时操作，，有可能出现下面的情况：

1.在g_num=0时，first_thread取得g_num=0.此时系统把first_thread调度为"sleeping"状态，把second_thread转换为"running"状态,t2也获得g_num=0

2.然后second_thread对得到的值进行加1并赋给g_num,使得g_num=1

3.然后系统又把second_thread调度为"sleeping",把first_thread转为"running".线程t1又把之前得到的0加1后赋值给g_num.

4.这样导致虽然first_thread和second_thread都对g_num加1，但结果仍然是g_num=1。

全局变量数据错误的解决办法

线程同步：保证同一时刻只能有一个线程去操作全局变量同步，就是协同步调，按预定的先后次序进行运行

线程同步的方式：

1.线程等待（join）

2.互斥锁

线程等待实现方式：

import threading


# 定义全局变量
g_num = 0

# 循环一次给全局变量加1
def sum_num1():
    for i in range(1000000):
        global g_num
        g_num += 1
    print("sum1:", g_num)

# 循环一次给全局变量加1
def sum_num2():
    for i in range(1000000):
        global g_num
        g_num += 1
    print("sum2:", g_num)

if __name__ == '__main__':
    # 创建两个线程
    first_thread = threading.Thread(target=sum_num1)
    second_thread = threading.Thread(target=sum_num2)

    first_thread.start()
    first_thread.join()

    second_thread.start()

运行结果：

sum1: 1000000
sum2: 2000000

***Repl Closed***

结论：多个线程同时对同一个全局变量进行操作，会有可能出现资源竞争数据错误的问题

线程同步方式可以解决资源竞争数据错误问题，但是这样有多任务变成了单任务

互斥锁

对共享数据进行锁定，保证同一时刻只能有一个线程去操作

抢到锁的线程先执行，没有抢到锁的线程需要等待，等锁用完后需要释放，然后其它等待的线程再去抢这个锁，哪个线程抢到，那个线程再执行

具体哪个线程抢到这个锁，我们决定不了，是由CPU调度决定的

线程同步能够保证多个线程安全访问竞争资源，最简单的同步机制是引入互斥锁

互斥锁为资源引入的一个状态：锁定/非锁定

某个线程要更改共享数据时，先将其锁定，此时资源的状态为"锁定"，其他线程不能更改；直到该线程释放资源，将资源的状态变成"非锁定"，其他的线程才能再次锁定该资源。互斥锁保证了每次只有一个线程进行写入操作，从而保证了多线程情况下数据的正确性。

创建锁：

a = threading.Lock()

锁定

a.acquire()

释放

a.release()

注意：

1.如果这个锁之前时没有上锁的，那么acquire不会堵塞

2.如果在调用acquire对这个锁上锁之前，它已经被其它线程上了锁，那么此时acquire会堵塞，直到这个锁被解锁为止

# 使用互斥锁完成2个线程对同一个全局变量各加100万次的操作
import threading


# 定义全局变量
g_num = 0

# 创建全局互斥锁
lock = threading.Lock()

# 循环一次给全局变量加1
def sum_num1():
    # 上锁
    lock.acquire()
    for i in range(1000000):
        global g_num
        g_num += 1

    print("sun1:", g_num)

    # 释放锁
    lock.release()

# 循环一次给全局变量加1
def sum_num2():
    # 上锁
    lock.acquire()
    for i in range(1000000):
        global g_num
        g_num += 1

    print("sum2:", g_num)

    # 释放锁
    lock.release()

if __name__ == '__main__':
    # 创建线程
    first_thread = threading.Thread(target=sum_num1)
    second_thread = threading.Thread(target=sum_num2)

    # 启动线程
    first_thread.start()
    second_thread.start()

运行结果：

sun1: 1000000
sum2: 2000000

***Repl Closed***

注意

加上互斥锁，哪个线程抢到这个锁我们决定不了，哪个线程抢到锁哪个线程先执行，没有抢到的线程需要等待

加上互斥锁多任务瞬间变成单任务，性能会下降，也就是说同一时刻只能有一个线程去执行

使用互斥锁的目的

能够保证多个线程访问共享数据不会出现资源竞争及数据错误

上锁、解锁过程

当一个线程调用锁的acquire()方法获得锁时，锁就进去了"locked"状态。

每次只有一个而线程可以获得锁，如果此时另一个线程试图获得这个锁，该线程就会变为"blocked"状态，称为"阻塞"，直到拥有锁的线程调用锁的release()方法释放锁之后，锁进入"unlocked"状态。

线程调度程序从处于同步阻塞状态的线程中选择一个来获得锁，并使得该线程进入运行"running"状态

死锁

一直等待对方释放锁的情景就是死锁

根据下标在列表中取值，但是要保证同一时刻只能有一个线程去取值

# 死锁示例：
import time, threading

# 创建互斥锁
lock = threading.Lock()

def get_value(index):
    # 上锁
    lock.acquire()
    print(threading.current_thread().name)
    my_list = [3, 6, 8, 1]
    # 判断下标释放越界
    if index >= len(my_list):
        print("下标越界：", index)
        
        return
    value = my_list[index]
    print(value)
    time.sleep(1)
    # 释放锁
    lock.release()

if __name__ == '__main__':
    # 模拟大量线程去执行取值操作

    for i in range(30):
        sub_thread = threading.Thread(target=get_value, args=(i,))
        sub_thread.start()

避免死锁：

# 死锁示例：
import time, threading

# 创建互斥锁
lock = threading.Lock()

def get_value(index):
    # 上锁
    lock.acquire()
    print(threading.current_thread().name)
    my_list = [3, 6, 8, 1]
    # 判断下标释放越界
    if index >= len(my_list):
        print("下标越界：", index)
        lock.release()
        return
    value = my_list[index]
    print(value)
    time.sleep(1)
    # 释放锁
    lock.release()

if __name__ == '__main__':
    # 模拟大量线程去执行取值操作

    for i in range(30):
        sub_thread = threading.Thread(target=get_value, args=(i,))
        sub_thread.start()

小结：使用互斥锁的时候需要注意死锁的问题，要在合适的地方注意释放锁

死锁一旦发生就会造成应用的停止响应

个人独立博客：www.limiao.tech
微信公众号：TechBoard

Python网络编程 —— 线程

线程的概念

单线程执行

多线程执行

多线程执行带有参数的任务

查看获取线程列表

注意

自定义线程

多线程共享全局变量

多线程同时对全局变量进行操作,导致数据可能出现错误

全局变量数据错误的解决办法

互斥锁

使用互斥锁的目的

上锁、解锁过程

死锁

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Python原教

大数据爬虫Python AI Sql

python

生活不易我用python

Python网络编程 —— 线程

线程的概念

单线程执行

多线程执行

多线程执行带有参数的任务

查看获取线程列表

注意

自定义线程

多线程共享全局变量

多线程同时对全局变量进行操作,导致数据可能出现错误

全局变量数据错误的解决办法

互斥锁

使用互斥锁的目的

上锁、解锁过程

死锁

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Python原教

大数据 爬虫Python AI Sql

python

生活不易 我用python

大数据爬虫Python AI Sql

生活不易我用python