美文网首页iOS 深度好文crash
iOS Crash监测及处理上传

iOS Crash监测及处理上传

作者: 地上的 | 来源:发表于2019-06-12 14:44 被阅读0次

    前段时间做了下项目里面的crash监测(自己拦截监测,不是bugly那些东西),然后保存crash信息,同步给服务器,进行crashlog解析,这里总结下相关的流程和知识点。后面会有完整demo。

    一、概念性东西

    符号表

    1、概念:符号表就是指在Xcode项目编译后,在编译生成的.app的同级目录下生成的同名的.dSYM文件。
    .dSYM文件其实是一个目录,在子目录中包含了一个16进制的保存函数地址映射信息的中转文件,所有Debug的symbols都在这个文件中(包括文件名、函数名、行号等),所以也称之为调试符号信息文件。
    2、作用:符号表就是用来符号化 crash log(崩溃日志)。crash log中有一些方法16进制的内存地址等,通过符号表就能找到对应的能够直观看到的方法名之类。
    3、获取途径:在Archive的时候会生成.xcarchive文件,然后显示包内容就能够在里面找到.dsYM文件和.app文件。

    二、Crash捕获

    iOS端的crash分为两类,一类是NSException异常,另外一类是Signal信号异常。这两类异常我们都可以通过注册相关函数来捕获。

    1、NSException异常捕获

    NSException异常是OC代码导致的crash,我们可以先调用NSGetUncaughtExceptionHandler获取之前注册的handler,如果有就保存起来,再通过NSSetUncaughtExceptionHandler方法注册自己的handler。

    NSUncaughtExceptionHandler *OldHandler = nil;
    void RegisterExceptionHandler(void) {
        if (NSGetUncaughtExceptionHandler() != MyExceptionHandler) {
            OldHandler = NSGetUncaughtExceptionHandler();
        }
        NSSetUncaughtExceptionHandler(&MyExceptionHandler);
    }
    

    注意:这里需要保存之前注册的handler的原因是,很多第三方SDK都会集成一个Crash收集服务,以及时发现自己SDK的问题。当各家的服务都以保证自己的Crash统计正确完整为目的时,难免出现时序手脚,强行覆盖等等的恶意竞争,总会有人默默被坑。
    如果同时有多方通过NSSetUncaughtExceptionHandler注册异常处理程序,和平的作法是:后注册者通过NSGetUncaughtExceptionHandler将先前别人注册的handler取出并备份,在自己handler处理完后自觉把别人的handler注册回去,规规矩矩的传递。不传递强行覆盖的后果是,在其之前注册过的日志收集服务写出的Crash日志就会因为取不到NSException而丢失Last Exception Backtrace等信息。(P.S. iOS系统自带的Crash Reporter不受影响)

    下面附上MyExceptionHandler的实现

    NSString * const UncaughtExceptionHandlerAddressesKey = @"UncaughtExceptionHandlerAddressesKey";
    //oc exception
    void MyExceptionHandler(NSException *exception) {
        NSArray *callStack = exception.callStackSymbols;
        NSMutableDictionary *userInfo = [NSMutableDictionary dictionaryWithDictionary:[exception userInfo]];
        [userInfo setObject:callStack forKey:UncaughtExceptionHandlerAddressesKey];
    
        [[[GHCrashManager alloc] init] performSelectorOnMainThread:@selector(handleException:) withObject:[NSException exceptionWithName:[exception name] reason:[exception reason] userInfo:userInfo] waitUntilDone:YES];
        
        // 调用之前已经注册的handler
        if (OldHandler) {
            OldHandler(exception);
        }
    }
    

    在这里就已经拿到了异常的NSException *exception对象,然后将里面的信息取出来做本地保存即可。

    2、Signal异常

    使用Objective-C的异常处理是不能得到signal的,如果要处理它,我们还要利用unix标准的signal机制。
    Signal信号是由iOS底层mach信号异常转换后以signal信号抛出的异常。既然是兼容posix标准的异常,我们可以通过sigaction函数以及signal函数注册对应的信号。
    这里会有两种实现:
    第一种:采用signal函数进行信号捕获(这里只注册了部分常见的信号)

    void RegisterSignalHandler(void) {
        signal(SIGHUP, SignalHandler);
        signal(SIGINT, SignalHandler);
        signal(SIGQUIT, SignalHandler);
        signal(SIGABRT, SignalHandler);
        signal(SIGILL, SignalHandler);
        signal(SIGSEGV, SignalHandler);
        signal(SIGFPE, SignalHandler);
        signal(SIGBUS, SignalHandler);
        signal(SIGPIPE, SignalHandler);
    }
    

    接下来附上获取到信号后的实现:

    void SignalHandler(int signal) {
        NSMutableDictionary *userInfo = [NSMutableDictionary dictionaryWithObject:[NSNumber numberWithInt:signal] forKey:UncaughtExceptionHandlerSignalKey];
        NSArray *callBack = [GHCrashManager backtrace];
        [userInfo setObject:callBack forKey:UncaughtExceptionHandlerAddressesKey];
        
        NSException *signalException = [NSException exceptionWithName:UncaughtExceptionHandlerSignalExceptionName reason:[NSString stringWithFormat:@"Signal %d was raised.",signal] userInfo:userInfo];
        [[[GHCrashManager alloc] init] performSelectorOnMainThread:@selector(handleException:) withObject:signalException waitUntilDone:YES];
    }
    

    第二种:采用sigaction函数进行信号捕获

    void (*OldAbrtSignalHandler)(int, struct __siginfo *, void *);
    void RegisterSignalHandler(void) {
        struct sigaction old_action;
        sigaction(SIGABRT, NULL, &old_action);
        if (old_action.sa_flags & SA_SIGINFO) {
            if (old_action.sa_sigaction != MySignalHandler) {
                OldAbrtSignalHandler = old_action.sa_sigaction;
            }
        }
    
        struct sigaction action;
        action.sa_sigaction = MySignalHandler;
        action.sa_flags = SA_NODEFER | SA_SIGINFO;
        sigemptyset(&action.sa_mask);
        sigaction(SIGABRT, &action, 0);
    }
    

    这里同样做了保存先前别人注册的handler。

    static void MySignalHandler(int signal, siginfo_t* info, void* context) {
        SignalHandler(signal);
        
        // 处理前者注册的 handler
        if (signal == SIGABRT) {
            if (OldAbrtSignalHandler) {
                OldAbrtSignalHandler(signal, info, context);
            }
        }
    }
    

    简单说一下sigaction和signal函数的区别:
    Linux主要有两个函数实现信号的安装登记:signal和sigaction。其中signal在系统调用的基础上实现,是库函数。它只有两个参数,不支持信号传递信息,主要是用于前32个非实时信号的安装;而sigaction是较新的函数(由两个系统调用实现:sys_signal以及sys_rt_sigaction),有三个参数,支持信号传递信息,主要用来与sigqueue系统调用配合使用。当然,sigaction同样支持非实时信号的安装,sigaction优于signal主要体现在支持信号带有参数,而signal使用简单,如果没有复杂使用场景可以直接使用signal函数。

    附上大部分信号的说明:

    1. SIGHUP
      本信号在用户终端连接(正常或非正常)结束时发出, 通常是在终端的控制进程结束时, 通知同一session内的各个作业, 这时它们与控制终端不再关联。
      登录Linux时,系统会分配给登录用户一个终端(Session)。在这个终端运行的所有程序,包括前台进程组和后台进程组,一般都属于这个 Session。当用户退出Linux登录时,前台进程组和后台有对终端输出的进程将会收到SIGHUP信号。这个信号的默认操作为终止进程,因此前台进 程组和后台有终端输出的进程就会中止。不过可以捕获这个信号,比如wget能捕获SIGHUP信号,并忽略它,这样就算退出了Linux登录, wget也 能继续下载。
      此外,对于与终端脱离关系的守护进程,这个信号用于通知它重新读取配置文件。
    2. SIGINT
      程序终止(interrupt)信号, 在用户键入INTR字符(通常是Ctrl-C)时发出,用于通知前台进程组终止进程。
    3. SIGQUIT
      和SIGINT类似, 但由QUIT字符(通常是Ctrl-)来控制. 进程在因收到SIGQUIT退出时会产生core文件, 在这个意义上类似于一个程序错误信号。
    4. SIGILL
      执行了非法指令. 通常是因为可执行文件本身出现错误, 或者试图执行数据段. 堆栈溢出时也有可能产生这个信号。
    5. SIGTRAP
      由断点指令或其它trap指令产生. 由debugger使用。
    6. SIGABRT
      调用abort函数生成的信号。
    7. SIGBUS
      非法地址, 包括内存地址对齐(alignment)出错。比如访问一个四个字长的整数, 但其地址不是4的倍数。它与SIGSEGV的区别在于后者是由于对合法存储地址的非法访问触发的(如访问不属于自己存储空间或只读存储空间)。
    8. SIGFPE
      在发生致命的算术运算错误时发出. 不仅包括浮点运算错误, 还包括溢出及除数为0等其它所有的算术的错误。
    9. SIGKILL
      用来立即结束程序的运行. 本信号不能被阻塞、处理和忽略。如果管理员发现某个进程终止不了,可尝试发送这个信号。
    10. SIGUSR1
      留给用户使用
    11. SIGSEGV
      试图访问未分配给自己的内存, 或试图往没有写权限的内存地址写数据.
    12. SIGUSR2
      留给用户使用
    13. SIGPIPE
      管道破裂。这个信号通常在进程间通信产生,比如采用FIFO(管道)通信的两个进程,读管道没打开或者意外终止就往管道写,写进程会收到SIGPIPE信号。此外用Socket通信的两个进程,写进程在写Socket的时候,读进程已经终止。
    14. SIGALRM
      时钟定时信号, 计算的是实际的时间或时钟时间. alarm函数使用该信号.
    15. SIGTERM
      程序结束(terminate)信号, 与SIGKILL不同的是该信号可以被阻塞和处理。通常用来要求程序自己正常退出,shell命令kill缺省产生这个信号。如果进程终止不了,我们才会尝试SIGKILL。
    16. SIGCHLD
      子进程结束时, 父进程会收到这个信号。
      如果父进程没有处理这个信号,也没有等待(wait)子进程,子进程虽然终止,但是还会在内核进程表中占有表项,这时的子进程称为僵尸进程。这种情 况我们应该避免(父进程或者忽略SIGCHILD信号,或者捕捉它,或者wait它派生的子进程,或者父进程先终止,这时子进程的终止自动由init进程 来接管)。
    17. SIGCONT
      让一个停止(stopped)的进程继续执行. 本信号不能被阻塞. 可以用一个handler来让程序在由stopped状态变为继续执行时完成特定的工作. 例如, 重新显示提示符
    18. SIGSTOP
      停止(stopped)进程的执行. 注意它和terminate以及interrupt的区别:该进程还未结束, 只是暂停执行. 本信号不能被阻塞, 处理或忽略.
    19. SIGTSTP
      停止进程的运行, 但该信号可以被处理和忽略. 用户键入SUSP字符时(通常是Ctrl-Z)发出这个信号
    20. SIGTTIN
      当后台作业要从用户终端读数据时, 该作业中的所有进程会收到SIGTTIN信号. 缺省时这些进程会停止执行.
    21. SIGTTOU
      类似于SIGTTIN, 但在写终端(或修改终端模式)时收到.
    22. SIGURG
      有”紧急”数据或out-of-band数据到达socket时产生.
    23. SIGXCPU
      超过CPU时间资源限制. 这个限制可以由getrlimit/setrlimit来读取/改变。
    24. SIGXFSZ
      当进程企图扩大文件以至于超过文件大小资源限制。
    25. SIGVTALRM
      虚拟时钟信号. 类似于SIGALRM, 但是计算的是该进程占用的CPU时间.
    26. SIGPROF
      类似于SIGALRM/SIGVTALRM, 但包括该进程用的CPU时间以及系统调用的时间.
    27. SIGWINCH
      窗口大小改变时发出.
    28. SIGIO
      文件描述符准备就绪, 可以开始进行输入/输出操作.
    29. SIGPWR
      Power failure
    30. SIGSYS
      非法的系统调用。

    其中要注意:

    • 在以上列出的信号中,程序不可捕获、阻塞或忽略的信号有:SIGKILL,SIGSTOP
    • 不能恢复至默认动作的信号有:SIGILL,SIGTRAP
    • 默认会导致进程流产的信号有:SIGABRT,SIGBUS,SIGFPE,SIGILL,SIGIOT,SIGQUIT,SIGSEGV,SIGTRAP,SIGXCPU,SIGXFSZ
      默认会导致进程退出的信号有:
    • SIGALRM,SIGHUP,SIGINT,SIGKILL,SIGPIPE,SIGPOLL,SIGPROF,SIGSYS,SIGTERM,SIGUSR1,SIGUSR2,SIGVTALRM
    • 默认会导致进程停止的信号有:SIGSTOP,SIGTSTP,SIGTTIN,SIGTTOU
    • 默认进程忽略的信号有:SIGCHLD,SIGPWR,SIGURG,SIGWINCH
    • 此外,SIGIO在SVR4是退出,在4.3BSD中是忽略;SIGCONT在进程挂起时是继续,否则是忽略,不能被阻塞。

    另:
    在debug模式下,如果你触发了signal崩溃,那么应用会直接崩溃到主函数,断点都没用,此时没有任何log信息显示出来,如果你想看log信息的话,你需要在lldb中,拿SIGABRT来说吧,敲入pro hand -p true -s false SIGABRT命令,不然你啥也看不到。或者也可以不连接xcode去run,如果你照着后面的crash捕获后处理了的话。

    三、Crash捕获之后的处理

    拿到exception对象后,做三件事:
    1、如果是debug环境下提示使用者;
    2、将crash信息保存在本地;
    3、移除自己的注册操作;
    (当然还有4、下次启动上传crashLog)。

    1、show出异常信息

    贴视图就不用说了,重点是要防止当前线程挂掉,那么就得使用runloop了。

    #ifdef DEBUG
        NSString *message = [NSString stringWithFormat:@"抱歉,APP发生了异常,请与开发人员联系,点击屏幕继续并自动复制错误信息到剪切板。\n\n异常报告:\n异常名称:%@\n异常原因:%@\n堆栈信息:%@\n", [exception name], [exception reason], stackInfo];
        NSLog(@"%@",message);
        [self showCrashToastWithMessage:message];//贴视图去显示,建议直接丢到window上
    
        CFRunLoopRef runLoop = CFRunLoopGetCurrent();
        CFArrayRef allModes = CFRunLoopCopyAllModes(runLoop);
        while (!self.dismissed) {
            for (NSString *mode in (__bridge NSArray *)allModes) {
                //为阻止线程退出,使用 CFRunLoopRunInMode(model, 0.001, false)等待系统消息,false表示RunLoop没有超时时间
                CFRunLoopRunInMode((CFStringRef)mode, 0.001, false);
            }
        }
        CFRelease(allModes);
    
    
    #endif
    
    2、存储就不说了,读写文件的事。
    3、移除自己的注册
    NSSetUncaughtExceptionHandler(NULL);
        signal(SIGHUP, SIG_DFL);
        signal(SIGINT, SIG_DFL);
        signal(SIGQUIT, SIG_DFL);
        signal(SIGABRT, SIG_DFL);
        signal(SIGILL, SIG_DFL);
        signal(SIGSEGV, SIG_DFL);
        signal(SIGFPE, SIG_DFL);
        signal(SIGBUS, SIG_DFL);
        signal(SIGPIPE, SIG_DFL);
        
        NSLog(@"%@",[exception name]);
        if ([[exception name] isEqual:UncaughtExceptionHandlerSignalExceptionName]) {
            kill(getpid(), [[[exception userInfo] objectForKey:UncaughtExceptionHandlerSignalKey] intValue]);
        } else {
            [exception raise];
        }
    

    到这里crash的捕获和本地存储都已经ok了,log也能上传到服务器了,接下来就剩拿到log和dsym文件进行符号化了。
    如果你想了解crash的原理和根源,建议读读漫谈iOS Crash收集框架
    另外,

    demo在这里,里面也附上了几种常见crash的案例,结合案例测试下吧。

    相关文章

      网友评论

        本文标题:iOS Crash监测及处理上传

        本文链接:https://www.haomeiwen.com/subject/mavzxctx.html