什么是进程?
一个程序运行起来后,代码+用到的资源称之为进程,它是操作系统分配资源的基本单元
进程额创建-multiprocessing
mutiprocessing模块就是跨平台版本的多进程模块,提供了一个Process类来代表一个进程对象,这个对象可以理解为是一个独立的进程,可以执行另外的事情
from multiprocessing import Process
import time
def run_proc():
"""子进程要执行的代码"""
while True:
print("2")
time.sleep(1)
if __name__ == '__main__':
p = Process(target=run_proc)
p.start()
while True:
print("1")
time.sleep(1)
Process参数如下:
Process(group,target,name,args,kwargs)
- targest:如果传递了函数的引用,可以任务这个子进程就执行这里代码
- args:给target指定的函数传递的参数,以元祖的方式传递
- kwargs:给target指定的函数传递命名参数
- name:给进程设定一个名字,可以不设定
- group:指定进程组,大多数情况下用不到
Process创建的实例对象的常用方法:
- strart():启动子进程实例(创建子进程)
- is_alive():判断进程子进程是否还在活着
- join([timeout]):是否等待子进程执行结束,或等待多少秒
- terminate():不管任务是否完成,立即终止子进程
Process创建的实例对象的常用属性:
- name:当前进程的别名,默认为Process-N,N为1开始递增的整数
- pid:当前进程的pid(进程号)
进程间通信-Queue
- Queue的使用可以使用multiprocessing模块的Queue实现多进程之间的数据传递,Queue本身是一个消息列队程序,以下小实例来演示一下Queue的工作原理
#coding=utf-8
from multiprocessing import Queue
q=Queue(3) #初始化一个Queue对象,最多可接收三条put消息
q.put("消息1")
q.put("消息2")
print(q.full()) #False
q.put("消息3")
print(q.full()) #True
#因为消息列队已满下面的try都会抛出异常,第一个try会等待2秒后再抛出异常,第二个Try会立刻抛出异常
try:
q.put("消息4",True,2)
except:
print("消息列队已满,现有消息数量:%s"%q.qsize())
try:
q.put_nowait("消息4")
except:
print("消息列队已满,现有消息数量:%s"%q.qsize())
#推荐的方式,先判断消息列队是否已满,再写入
if not q.full():
q.put_nowait("消息4")
#读取消息时,先判断消息列队是否为空,再读取
if not q.empty():
for i in range(q.qsize()):
print(q.get_nowait())
- Queue.qsize():返回当前队列包含的消息数量;
- Queue.empty():如果队列为空,返回Ture,反之False:
- Queue.full():如果队列满了,返回True,反之False:
- Queue.get(block,timeout):获取队列中的一条消息,然后将其从列队中移除,默认值为True:
进程池Pool
- 当需要创建的子进程数量不多时,可以直接利用multirocessing中的Process动态生多个进程,但如果是上百甚至上千个目标,手动的去创建进程的工作两巨大,就可以用到mulitiprocessing模块提供的Pool方法
- 初始化Pool时,可以指定一个最大进程数,当有新的请求提交到Pool中时,如果池还没有满,那么就会创建一个新的进程用来执行该请求;但如果池中的进程数已经达到指定的最大值,那么该请求就会等待,直到池中有进程结束,才会用之前的进程来执行新任务,请看下面的实例:
-- coding:utf-8 --
from multiprocessing import Pool
import os, time, random
def worker(msg):
t_start = time.time()
print("%s开始执行,进程号为%d" % (msg,os.getpid()))
# random.random()随机生成0~1之间的浮点数
time.sleep(random.random()*2)
t_stop = time.time()
print(msg,"执行完毕,耗时%0.2f" % (t_stop-t_start))
po = Pool(3) # 定义一个进程池,最大进程数3
for i in range(0,10):
# Pool().apply_async(要调用的目标,(传递给目标的参数元祖,))
# 每次循环将会用空闲出来的子进程去调用目标
po.apply_async(worker,(i,))
print("----start----")
po.close() # 关闭进程池,关闭后po(进程池)不再接收新任务
po.join() # 等待po(进程池)中所有子进程执行完成,必须放在close语句之后
print("-----end-----")
网友评论