并行与并发
1. 计算机是如何执行程序指令的?
image.png2. 计算机是如何实现并发?
轮询调度实现并发执行
image.png
3. 真正的并行需要依赖什么?
image.png总结:
并行是基于多处理器多核而言的,让多个处理器多核真正同时跑多个程序或多个进程。而并发是单个处理器而言的,同一时刻每个处理器只会执行一个进程,然后在不同进程间快速切换,宏观上给人以多个程序同时运行的感觉,但微观上单个处理器还是串行工作的。同理,在一个进程中,程序的执行也是不同线程间进行切换的,每个线程执行程序的的不同部分。这就意味着当一个线程等待网页下载时,进程可以切换到其他线程执行,避免浪费处理器时间。因此,为了充分利用计算机中的所有资源尽可能快地下载数据,我们需要将下载分发到多个进程和线程中。
并发是指一次处理多件事,而并行是指一次做多件事。二者不同,但互相有联系。
多进程实现并行
什么是进程?
- 计算机程序是存储在磁盘上的文件。
只有把它们加载到内存中,并被操作系统调用它们才会拥有其自己的生命周期。 - 进程表示一个正在执行的程序。
每个进程都有独立地址空间以及其他的辅助数据
进程(Process)
是计算机中已运行程序的实例。
python中使用进程
我们先看一个程序
import time
def func(data,num):
while True:
print('我是子进程{}-{}'.format(data,num))
def main():
while True:
print('我是主进程')
if __name__ == '__main__':
func(1, 2)
print('-------------')
main()
结果:
image.png
从结果这样如果直接调用func,则一直在循环,而不能打印下面的语句main()
。
此时我们可以利用多进程来做,两个不干扰。
进程使用步骤:
image.pngimport time
import multiprocessing
def func(data,num):
while True:
print('我是子进程{}-{}'.format(data,num))
def main():
while True:
print('我是主进程')
if __name__ == '__main__':
#func(1, 2)
process = multiprocessing.Process(target=func, args=(1,2)) #创建一个进程
process.start() #运行创建好的进程
main()
结果:
image.png
从结果可以看出来,两个函数来回调用。
多进程并行的必要条件:
总进程数量不多于cpu核心数量!如果不满足,那么运行的程序都是轮询调度产生的假象。
多线程实现并发
什么是线程
- 线程被称作轻量级进程。
线程是进程中的一个实体,操作系统不会为进程分配内存空间,它只有一点在运行中必不可少的资源 - 线程被包含在进程中,是进程中的实际运作单位
同一个进程内的多个线程会共享相同的上下文,也就是共享资源(内存和数据)。 - 线程(thread)
是操作系统能够进行运算调度的最小单位。
python中使用线程
线程使用步骤:
image.png
import time
import multiprocessing
import threading
def func(data,num):
while True:
print('我是线程1{}-{}'.format(data,num))
def main():
while True:
print('我是线程2')
if __name__ == '__main__':
#func(1, 2)
# process = multiprocessing.Process(target=func, args=(1,2)) #创建一个进程
# process.start() #运行创建好的进程
thread = threading.Thread(target=func, args=(1,2))
thread.start()
main()
结果与使用进程一样。
进程 VS 线程
- 稳定性
进程具有独立的地址空间,一个进程崩溃后,不会对其它进程产生影响。
线程共享地址空间,一个线程非法操作共享数据崩溃后,整个进程就崩溃了。 - 创建开销
创建进程操作系统是要分配内存空间和一些其他资源的。开销很大
创建线程操作系统不需要再单独分配资源,开销较小。 - 切换开销
不同进程直接是独立的, 切换需要耗费较大资源线程共享进程地址空间, 切换开销小。
GIL锁(线程锁)
Python在设计的时候,还没有多核处理器的概念。因此,为了设计方便与线程安全,直接设计了一个锁。这个锁要求,任何进程中,一次只能有一个线程在执行。因此,并不能为多个线程分配多个CPU。所以Python中的线程只能实现并发,而不能实现真正的并行。
但是Python3中的GIL锁有一个很棒的设计,在遇到阻塞(不是耗时)的时候,会自动切换线程。
遇到阻塞就自动切换。我们可以利用这种机制来充分利用CPU。
使用多进程与多线程来实现并发服务器
关键点:
- 多进程是并行执行, 相当于分别独立得处理各个请求。
- 多线程,虽然不能并行运行, 但是可以通过避开阻塞切换线程来实现并发的效果,并且不浪费cpu。
import socket
import multiprocessing
server = socket.socket()
server.bind(('0.0.0.0', 7001))
server.listen()
print('等待连接.....')
def recv_data(conn):
while True:
data = conn.recv(1024)
if data:
print('接受的数据>>>{}'.format(data.decode()))
conn.send(data)
else:
conn.close()
break
def accept():
while True:
conn, addr = server.accept()
print('来自{}的连接'.format(addr))
#每生成一个对等连接套接字,就生成一个进程,并交给这个进程去处理。
process = multiprocessing.Process(target=recv_data, args=(conn,))
process.start()
process = multiprocessing.Process(target=accept)
process.start()
多线程类似。
网友评论