美文网首页
python多进程文件操作的一些理解

python多进程文件操作的一些理解

作者: 4ffde5305e8f | 来源:发表于2017-01-13 15:35 被阅读0次

    如果多进程都对同一个文件进行写入,那么就会出现多个进程争夺资源的问题。会使写入的文件内容错乱。
    1. 写入文件: 同一时间,只能有一个进程,对文件进行写入操作。这是操作系统的设定
    2. 多进程写入文件: 由操作系统随机决定哪个进程来写入操作。
    因为这种决策是随机,完全无序的。所以写入文件时,会造成文件顺序的错乱。
    一个进程执行多长时间是由操作系统决定的。而且程序的执行单元是原子型的,
    也就是说一行汇编代码才是一个执行单元,并不是Python中的一行代码才是一个执行单元。

    3. 执行单元:最小的原子型的不可分割的一个执行动作。
       比如:一共十个进程,每个进程写十个字,写十个字算是一个完整的操作。一个字全是一个执行单元。
       那么一个进程可能写完十个字,也就是一个完整的操作后,由系统决定切换到另外一个进程。
       也可能一个进程1写三个字,系统就切换另外一个进程3来进行操作。进程3写了二个字,系统切换到进程5,继续写入。
     这样就造成了文件内容的错乱。一行内有进程1的三个字,进程3的两个字,进程5的字。
    

    解决办法:
    1. 对写入操作 进行加锁
    就是说:对当前进行写入操作的进程锁定,直到该进程写完十个字,也就是一个完成的操作,后解除该进程的锁定,放它离开。切换到另外一个进程来操作。
    因为一次只能一个进程执行写入操作,而且必须执行完成完整的操作,才允许切换。所以不会造成文件内容的混乱。
    但是加锁一般会完造成程序的执行效率下降。而且,如果写入操作分散在整个代码的多处,
    总不能把整个代码都锁起来吧,这样岂不是又成单进程了么?
    所以:把写入操作抽象出来为单独的一个函数,这样对单独的一个函数加群,这样问题就不大了。
    更优雅的方法:使用multiprocessing的回调函数。
    1。把写入操作抽象为单独的一个函数
    2。把进程需要写入的内容,作为返回值返回
    3。使用回调函数写入进程返回内容。

    def myCallBack(x):
           文件操作,写入x到文件
    def getInfo(num):
           返回需要写入的内容
           return num
    
    pool = multiprocessing.Pool()
    for i in range(10):
           pool.apply_async(getInfo,(i,),callback=myCallBack)
    pool.close()
    pool.join()
    
    apply_async用于传递不定参数,同python中的apply函数一致。但他是非阻塞的且支持结果返回后进行回调。
    close() 关闭pool,使其不再接受新的任务
    join()  主进程阻塞等待子进程的退出, join方法要在close后使用。
    

    相关文章

      网友评论

          本文标题:python多进程文件操作的一些理解

          本文链接:https://www.haomeiwen.com/subject/rtjsbttx.html