美文网首页
从一个crash分析到苹果的代码问题

从一个crash分析到苹果的代码问题

作者: 偶是星爷 | 来源:发表于2019-07-18 14:43 被阅读0次

    先看一下收到的crash堆栈


    objc_retain

    完全是系统函数,不能简单的从自身代码找问题。

    先看一下错误原因,SEGV_ACCERR是内存访问失败的错误,一般是对象被释放的情况比较多。不过这个堆栈全部是系统函数,比较难判断是那个对象被释放了。

    堆栈里唯一比较眼熟的是 -[AVPlayerItemVideoOutput _dispatchOutputMediaDataWillChange] , 所以我们看一下这个方法的汇编代码

    (lldb) dis -n '-[AVPlayerItemVideoOutput _dispatchOutputMediaDataWillChange]'
    AVFoundation`-[AVPlayerItemVideoOutput _dispatchOutputMediaDataWillChange]:
        0x188fbb8c0 <+0>:   sub    sp, sp, #0x60             ; =0x60 
        0x188fbb8c4 <+4>:   stp    x22, x21, [sp, #0x30]
        0x188fbb8c8 <+8>:   stp    x20, x19, [sp, #0x40]
        0x188fbb8cc <+12>:  stp    x29, x30, [sp, #0x50]
        0x188fbb8d0 <+16>:  add    x29, sp, #0x50            ; =0x50 
        0x188fbb8d4 <+20>:  mov    x19, x0
        0x188fbb8d8 <+24>:  adrp   x8, 176802
        0x188fbb8dc <+28>:  ldrsw  x20, [x8, #0x244]
        0x188fbb8e0 <+32>:  ldr    x8, [x19, x20]
        0x188fbb8e4 <+36>:  adrp   x21, 176802
        0x188fbb8e8 <+40>:  ldrsw  x9, [x21, #0x230]
        0x188fbb8ec <+44>:  ldrb   w9, [x8, x9]
        0x188fbb8f0 <+48>:  cbnz   w9, 0x188fbb904           ; <+68>
        0x188fbb8f4 <+52>:  adrp   x9, 176802
        0x188fbb8f8 <+56>:  ldrsw  x9, [x9, #0x228]
        0x188fbb8fc <+60>:  ldrb   w9, [x8, x9]
        0x188fbb900 <+64>:  cbz    w9, 0x188fbb960           ; <+160>
        0x188fbb904 <+68>:  adrp   x9, 176802
        0x188fbb908 <+72>:  ldrsw  x9, [x9, #0x214]
        0x188fbb90c <+76>:  ldr    x9, [x8, x9]
        0x188fbb910 <+80>:  cbz    x9, 0x188fbb960           ; <+160>
        0x188fbb914 <+84>:  adrp   x10, 176802
        0x188fbb918 <+88>:  ldrsw  x10, [x10, #0x21c]
        0x188fbb91c <+92>:  ldr    x0, [x8, x10]
        0x188fbb920 <+96>:  adrp   x8, 153392
        0x188fbb924 <+100>: ldr    x8, [x8, #0x6e0]
        0x188fbb928 <+104>: str    x8, [sp]
        0x188fbb92c <+108>: adrp   x8, 91
        0x188fbb930 <+112>: ldr    d0, [x8, #0x260]
        0x188fbb934 <+116>: str    d0, [sp, #0x8]
        0x188fbb938 <+120>: adrp   x8, 0
        0x188fbb93c <+124>: add    x8, x8, #0x99c            ; =0x99c 
        0x188fbb940 <+128>: str    x8, [sp, #0x10]
        0x188fbb944 <+132>: adrp   x8, 153408
        0x188fbb948 <+136>: add    x8, x8, #0xcb8            ; =0xcb8 
        0x188fbb94c <+140>: stp    x8, x9, [sp, #0x18]
        0x188fbb950 <+144>: str    x19, [sp, #0x28]
        0x188fbb954 <+148>: mov    x1, sp
        0x188fbb958 <+152>: bl     0x189014094               ; symbol stub for: __46-[AVCaptureMetadataOutput _updateRemoteQueue:]_block_invoke
        0x188fbb95c <+156>: ldr    x8, [x19, x20]
        0x188fbb960 <+160>: adrp   x9, 176802
        0x188fbb964 <+164>: ldrsw  x9, [x9, #0x224]
        0x188fbb968 <+168>: str    xzr, [x8, x9]
        0x188fbb96c <+172>: ldr    x8, [x19, x20]
        0x188fbb970 <+176>: adrp   x9, 176802
        0x188fbb974 <+180>: ldrsw  x9, [x9, #0x228]
        0x188fbb978 <+184>: strb   wzr, [x8, x9]
        0x188fbb97c <+188>: ldr    x8, [x19, x20]
        0x188fbb980 <+192>: ldrsw  x9, [x21, #0x230]
        0x188fbb984 <+196>: strb   wzr, [x8, x9]
        0x188fbb988 <+200>: ldp    x29, x30, [sp, #0x50]
        0x188fbb98c <+204>: ldp    x20, x19, [sp, #0x40]
        0x188fbb990 <+208>: ldp    x22, x21, [sp, #0x30]
        0x188fbb994 <+212>: add    sp, sp, #0x60             ; =0x60 
        0x188fbb998 <+216>: ret    
    

    第152行有一个很关键的提示

    symbol stub for: __46-[AVCaptureMetadataOutput _updateRemoteQueue:]_block_invoke
    

    根据名字可以发现,应该是在block里调用了 _updateRemoteQueue: 方法,_updateRemoteQueue: 在调用dispatch_async时出错,很可能是queue被释放了。

    项目里代码用到AVPlayerItemVideoOutput是这样写的

    _myVideoOutputQueue = dispatch_queue_create("myVideoOutputQueue", DISPATCH_QUEUE_SERIAL);
    [_videoOutput setDelegate:self queue:_myVideoOutputQueue];
    

    在释放的时候直接这样写的

    [_player.currentItem removeOutput:_videoOutput];
    _myVideoOutputQueue = nil;
    [_play pause];
    

    _myVideoOutputQueue都是在主线程使用,正常释放。

    再看AVPlayerItemOutput的接口声明

    /*!
        @property       delegateQueue
        @abstract       The dispatch queue where the delegate is messaged.
     */
    
    @property (nonatomic, readonly, nullable) dispatch_queue_t delegateQueue;
    

    看到这里心里大概就有数了,delegateQueue被声明为nonatomic,当对象被释放时,另一个线程访问就可能出现问题。

    为什么nonatomic会有线程安全问题?这要看一下objc的源码

    id objc_getProperty(id self, SEL _cmd, ptrdiff_t offset, BOOL atomic) {
        if (offset == 0) {
            return object_getClass(self);
        }
    
        // Retain release world
        id *slot = (id*) ((char*)self + offset);
        if (!atomic) return *slot;
            
        // Atomic retain release world
        spinlock_t& slotlock = PropertyLocks[slot];
        slotlock.lock();
        id value = objc_retain(*slot);
        slotlock.unlock();
        
        // for performance, we (safely) issue the autorelease OUTSIDE of the spinlock.
        return objc_autoreleaseReturnValue(value);
    }
    

    nonatomic取到函数地址后,直接返回指针指向的值,如果这时 *slot 正好被释放,那么返回的就是一个错误的值;而atomic会先retain,然后放到自动释放池,这样就能保证返回的对象一定不会被释放。

    这里正好想到前几天另一个出现概率很大的crash

    #59 Thread
    SIGSEGV
    SEGV_ACCERR
    解析原始
    0 libobjc.A.dylib   objc_msgSend (respondsToSelector:) + 16
    1 libdispatch.dylib __dispatch_call_block_and_release + 24
    2 libdispatch.dylib __dispatch_client_callout + 16
    3 libdispatch.dylib __dispatch_lane_serial_drain$VARIANT$mp + 592
    4 libdispatch.dylib __dispatch_lane_invoke$VARIANT$mp + 428
    5 libdispatch.dylib __dispatch_workloop_worker_thread + 596
    6 libsystem_pthread.dylib   _pthread_wqthread + 300
    7 libsystem_pthread.dylib   start_wqthread + 0
    

    看上去是在一个gcd的block里,调用了respondsToSelector:,很显然是一个delegate。项目里所有的delegate都是weak声明的,理论上不会出现指针悬空的问题,直到我看到了这一行

    @interface AVPlayerItemVideoOutput : AVPlayerItemOutput
    /*!
        @property       delegate
        @abstract       The receiver's delegate.
     */
    @property (nonatomic, readonly, assign, nullable) id<AVPlayerItemOutputPullDelegate> delegate;
    
    @end
    

    delegate的这种错误是很多年前才会有的,没想到这竟然出自官方代码。

    UIKit的属性都是声明为nonatomic,因为都是在主线程调用,所以不加锁其实是可以接受的,但是音视频很多都是在非主线程操作的,为了安全牺牲一点点性能,是有必要的。

    最后,解决问题很简单。既然delegateQueue不安全,那么就传nil进去吧,或者搞一个静态的dispatch_queue;delegate问题可以修改代码逻辑,在停止播放的时候清掉这个回调,这样保证当self释放时,videoOutpu的delegate已经是nil了。

    相关文章

      网友评论

          本文标题:从一个crash分析到苹果的代码问题

          本文链接:https://www.haomeiwen.com/subject/vymqlctx.html