本文翻译自:Is lock-free logging safe?
最近,我看到了monologgerproject。它声称给ruby2.0提供了不用加锁的日志系统。当我看到这个项目时,我在想:Cool!我要看看他们用什么技术来实现这种日志系统的。一开始觉的他是非常简单易懂的。当我深入理解并将它与ruby中的标准库Logger比较时,发现他俩是完全一样的,不过减去了互斥(mutex).
这里让我不明白的是,无锁的日志系统安全吗?Ruby添加互斥锁的原因之一可能就是为了安全起见。如果在同一时间,多个线程同时写一个日志文件会怎么样?插入的日志信息会不会像下面:
当我开始寻找这个问题的答案时,我意识到我所问的首要问题是:write(2)的调用是原子性的吗?
换句话说,如果两个线程或两个进程同时写入同一个文件,那么写入是原子的吗?还是可以交叉的?
Unix beard too short...
这是一个深奥的Unix问题。
当我在mono_logger的bug跟踪系统中提出这个问题时,我承认我实在等不及想知道这个问题的答案。于是我转向求助我最喜欢的Unix编程书籍:The Linux Programming Interface.
它得到了我想要的答案。有一些知识可以帮助我们解决这个问题。
首先,所有的系统调用都是原子性的。这句话来自TLPI:
"All system calls are executed atomically. By this, we mean that the kernel guarantees that all of the steps in a system call are completed as a single operation, without being interrupted by another process of thread."
太好了!于是当两个线程或进程在同一时间写同一文件时,我们可以肯定他们的数据不会交错插入。这使调用write(2)不需要互斥锁,而且还能保证原子性,因为内核已经帮我们做到那个了。
但是还有一个问题,一般写文件时,你需要找到你想插入的具体的位置,然后再进行真正的写入操作。不幸的是,这会涉及到两个系统调用,lseek(2)和write(2).他们各自是原子性的,但是两个操作作为一个整体就不是原子性的。让我们来证明下:
用下面的伪代码表示写文件的过程:
lseek(fd,0,SEEK_END);// seek to the end of the file
write(fd,"log message",len);// perform the write
在多线程环境下,这种操作是不安全的。通过这两个系统调用不能保证原子性,例如下面的情况:
d'oh 线程A不在指向文件的真正末尾位置,它指向文件先前的默认位置,线程B写入信息的位置。当线程A写入文件时,可能被线程B写入的信息覆盖。
通过这种方法写文件,有可能会丢失数据。
但是还有一种方法。
为了能保证seek和write两个操作发生的原子性,你可以设置O_APPEND标志,当你在打开一个文件时。然后,任何往文件追加的写操作都能保证是原子性的。这正是我们在写要共享日志文件时想要的情况。Logger和MonoLogger都是用这个标志来打开文件。
open(filename,(FILE::WRONLY|FILE::APPEND))
因此MonoLogger可以原子性的追加到日志系统,而不需要互斥信号。
我用python写了一个测试程序如下:
测试程序一:
测试程序二:
网友评论