美文网首页c++
[转]为什么多线程读写 shared_ptr 要加锁?

[转]为什么多线程读写 shared_ptr 要加锁?

作者: 行走的代码 | 来源:发表于2020-06-20 18:22 被阅读0次

    (shared_ptr)的引用计数本身是安全且无锁的,但对象的读写则不是,因为 shared_ptr 有两个数据成员,读写操作不能原子化。根据文档(http://www.boost.org/doc/libs/release/libs/smart_ptr/shared_ptr.htm#ThreadSafety), shared_ptr 的线程安全级别和内建类型、标准库容器、std::string 一样,即:

    • 一个 shared_ptr 对象实体可被多个线程同时读取(文档例1);

    • 两个 shared_ptr 对象实体可以被两个线程同时写入(例2),“析构”算写操作;

    • 如果要从多个线程读写同一个 shared_ptr 对象,那么需要加锁(例3~5)。

    请注意,以上是 shared_ptr 对象本身的线程安全级别,不是它管理的对象的线程安全级别。

    后文(p.18)则介绍如何高效地加锁解锁。本文则具体分析一下为什么“因为 shared_ptr 有两个数据成员,读写操作不能原子化”使得多线程读写同一个 shared_ptr 对象需要加锁。这个在我看来显而易见的结论似乎也有人抱有疑问,那将导致灾难性的后果,值得我写这篇文章。本文以 boost::shared_ptr 为例,与 std::shared_ptr 可能略有区别。

    shared_ptr 的数据结构
    shared_ptr 是引用计数型(reference counting)智能指针,几乎所有的实现都采用在堆(heap)上放个计数值(count)的办法(除此之外理论上还有用循环链表的办法,不过没有实例)。具体来说,shared_ptr<Foo> 包含两个成员,一个是指向 Foo 的指针 ptr,另一个是 ref_count 指针(其类型不一定是原始指针,有可能是 class 类型,但不影响这里的讨论),指向堆上的 ref_count 对象。ref_count 对象有多个成员,具体的数据结构如图 1 所示,其中 deleter 和 allocator 是可选的。


    28051715-e28b1c2264504cb1a275b916a641ecbb.png

    图 1:shared_ptr 的数据结构。

    为了简化并突出重点,后文只画出 use_count 的值:

    28051715-e28b1c2264504cb1a275b916a641ecbb.png

    以上是 shared_ptr<Foo> x(new Foo); 对应的内存数据结构。

    如果再执行 shared_ptr<Foo> y = x; 那么对应的数据结构如下。

    28051715-e28b1c2264504cb1a275b916a641ecbb.png

    但是 y=x 涉及两个成员的复制,这两步拷贝不会同时(原子)发生。

    中间步骤 1,复制 ptr 指针:


    28051715-e28b1c2264504cb1a275b916a641ecbb.png

    中间步骤 2,复制 ref_count 指针,导致引用计数加 1:


    28051715-e28b1c2264504cb1a275b916a641ecbb.png

    步骤1和步骤2的先后顺序跟实现相关(因此步骤 2 里没有画出 y.ptr 的指向),我见过的都是先1后2。

    既然 y=x 有两个步骤,如果没有 mutex 保护,那么在多线程里就有 race condition。

    多线程无保护读写 shared_ptr 可能出现的 race condition
    考虑一个简单的场景,有 3 个 shared_ptr<Foo> 对象 x、g、n:

    shared_ptr<Foo> g(new Foo); // 线程之间共享的 shared_ptr
    shared_ptr<Foo> x; // 线程 A 的局部变量
    shared_ptr<Foo> n(new Foo); // 线程 B 的局部变量
    一开始,各安其事。


    28051715-e28b1c2264504cb1a275b916a641ecbb.png

    线程 A 执行 x = g; (即 read g),以下完成了步骤 1,还没来及执行步骤 2。这时切换到了 B 线程。

    28051715-e28b1c2264504cb1a275b916a641ecbb.png

    同时编程 B 执行 g = n; (即 write g),两个步骤一起完成了。

    先是步骤 1:


    28051715-e28b1c2264504cb1a275b916a641ecbb.png

    再是步骤 2:


    28051715-e28b1c2264504cb1a275b916a641ecbb.png

    这是 Foo1 对象已经销毁,x.ptr 成了空悬指针!

    最后回到线程 A,完成步骤 2:


    28051715-e28b1c2264504cb1a275b916a641ecbb.png

    多线程无保护地读写 g,造成了“x 是空悬指针”的后果。这正是多线程读写同一个 shared_ptr 必须加锁的原因。

    当然,race condition 远不止这一种,其他线程交织(interweaving)有可能会造成其他错误。
    ————————————————
    版权声明:本文为CSDN博主「陈硕」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/Solstice/java/article/details/8547547

    相关文章

      网友评论

        本文标题:[转]为什么多线程读写 shared_ptr 要加锁?

        本文链接:https://www.haomeiwen.com/subject/rtegxktx.html