Linux下多进程写同一文件，要不要加锁？

作者: 污污老师 | 来源:发表于2017-06-16 10:52 被阅读0次

最近，我看到了monologgerproject。它声称给ruby2.0提供了不用加锁的日志系统。当我看到这个项目时，我在想：Cool!我要看看他们用什么技术来实现这种日志系统的。一开始觉的他是非常简单易懂的。当我深入理解并将它与ruby中的标准库Logger比较时，发现他俩是完全一样的，不过减去了互斥(mutex).

这里让我不明白的是，无锁的日志系统安全吗？Ruby添加互斥锁的原因之一可能就是为了安全起见。如果在同一时间，多个线程同时写一个日志文件会怎么样？插入的日志信息会不会像下面：

当我开始寻找这个问题的答案时，我意识到我所问的首要问题是:write(2)的调用是原子性的吗?

换句话说，如果两个线程或两个进程同时写入同一个文件，那么写入是原子的吗?还是可以交叉的?

Unix beard too short...

这是一个深奥的Unix问题。
当我在mono_logger的bug跟踪系统中提出这个问题时，我承认我实在等不及想知道这个问题的答案。于是我转向求助我最喜欢的Unix编程书籍：The Linux Programming Interface.

它得到了我想要的答案。有一些知识可以帮助我们解决这个问题。

首先，所有的系统调用都是原子性的。这句话来自TLPI:

"All system calls are executed atomically. By this, we mean that the kernel guarantees that all of the steps in a system call are completed as a single operation, without being interrupted by another process of thread."

太好了！于是当两个线程或进程在同一时间写同一文件时，我们可以肯定他们的数据不会交错插入。这使调用write(2)不需要互斥锁，而且还能保证原子性，因为内核已经帮我们做到那个了。

但是还有一个问题，一般写文件时，你需要找到你想插入的具体的位置，然后再进行真正的写入操作。不幸的是，这会涉及到两个系统调用，lseek(2)和write(2).他们各自是原子性的，但是两个操作作为一个整体就不是原子性的。让我们来证明下：

用下面的伪代码表示写文件的过程：

lseek(fd,0,SEEK_END);// seek to the end of the file

write(fd,"log message",len);// perform the write

在多线程环境下，这种操作是不安全的。通过这两个系统调用不能保证原子性，例如下面的情况：

d'oh 线程A不在指向文件的真正末尾位置，它指向文件先前的默认位置，线程B写入信息的位置。当线程A写入文件时，可能被线程B写入的信息覆盖。

通过这种方法写文件，有可能会丢失数据。

但是还有一种方法。

为了能保证seek和write两个操作发生的原子性，你可以设置O_APPEND标志，当你在打开一个文件时。然后，任何往文件追加的写操作都能保证是原子性的。这正是我们在写要共享日志文件时想要的情况。Logger和MonoLogger都是用这个标志来打开文件。

open(filename,(FILE::WRONLY|FILE::APPEND))

因此MonoLogger可以原子性的追加到日志系统，而不需要互斥信号。

我用python写了一个测试程序如下：

测试程序一：

测试程序二：

网友评论

本文标题：Linux下多进程写同一文件，要不要加锁？

本文链接：https://www.haomeiwen.com/subject/kmdfattx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Linux下多进程写同一文件，要不要加锁？

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读