美文网首页
iOS App 启动优化 - 二进制重排

iOS App 启动优化 - 二进制重排

作者: iVikings | 来源:发表于2020-04-29 13:00 被阅读0次

    众所周知,App 的启动速度对用户体验会有一定的影响,因此,为追求用户体验,启动速度的优化必然是App开发过程中,不可或缺的一个环节。那么我们需要先分析App在启动过程中都做了些什么事?

    App启动分析

    App启动分为 冷启动热启动

    • 冷启动:点击 App 启动前,它的进程不在系统里,需要系统新创建一个进程分配给它的情况。这是一次完整的启动过程
    • 热启动:App 在冷启动后,用户将App 退到后台,即在App的进程还在系统里的情况下,用户重新启动进入 App 的过程,这个过程做的事情非常少,启动速度非常快。

    因此,我们主要针对 App 冷启动进行优化

    一般而言,App 启动时间,指的是从用户点击 App 开始,到用户看到第一个界面之间的时间,总结来说:App 的启动主要包括三个阶段:

    1. main() 函数执行前
    2. main() 函数执行后
    3. 首屏渲染完成后

    main() 函数执行前

    1、pre-main耗时检测
    通过设置环境变量来统计 pre-main 的耗时

    选择 Edit Scheme - Arguments - Environment Variables
    添加 name DYLD_PRINT_STATISTICS value : ${DEBUG_ACTIVITY_MODE}

    image.png

    运行Xcode,控制台输出如下:

    Total pre-main time: 746.33 milliseconds (100.0%)
             dylib loading time: 113.32 milliseconds (15.1%)
            rebase/binding time:   4.98 milliseconds (0.6%)
                ObjC setup time: 369.16 milliseconds (49.4%)
               initializer time: 258.71 milliseconds (34.6%)
               slowest intializers :
                 libSystem.B.dylib :  14.13 milliseconds (1.8%)
        libMainThreadChecker.dylib : 153.40 milliseconds (20.5%)
                            Spirit :  64.53 milliseconds (8.6%)
    

    可见,在 main() 函数执行前,系统主要会做下面几件事情:

    • dylib loading:加载可执行文件(App 的.o 文件的集合),加载动态链接库
    • rebase/binding:对动态链接库进行 rebase 指针调整和 bind 符号绑定;
    • Objc setup:Objc 运行时的初始化处理,包括 Objc 相关类的注册、category 注册、selector 唯一性检查等;
    • initializer:初始化,包括了执行 +load() 方法、attribute((constructor)) 修饰的函数的调用、创建 C++ 静态全局变量。

    相应地,这个阶段对于启动速度优化来说,可以做的事情包括:

    • 减少动态库加载:每个库本身都有依赖关系,苹果公司建议使用更少的动态库,并且建议在使用动态库的数量较多时,尽量将多个动态库进行合并。数量上,苹果公司建议最多使用 6 个非系统动态库
    • 减少加载启动后不会去使用的类或者方法。
    • +load()方法里的内容可以放到首屏渲染完成后再执行,或使用 +initialize()方法替换掉。因为,在一个 +load() 方法里,进行运行时方法替换操作会带来 4 毫秒的消耗。不要小看这 4 毫秒,积少成多,执行 +load() 方法对启动速度的影响会越来越大。
    • 控制 C++ 全局变量的数量。

    当我们做了以上工作,对 pre-main 的时间有所优化之后,如果还想再进行优化,那就需要使用 LLVM 为我们提供的优化方式:二进制重排

    二进制重排

    背景:APP启动时需要优先执行的函数分散在各个 Page,就会导致多次 Page Fault 造成时间的损耗

    • Page Fault

    APP 进程通过 虚拟内存物理内存之间的映射来进行访问(直接访问物理内存是不安全的,虚拟内存地址分配还会涉及到 ASLR),为了提高效率和方便管理,又对虚拟内存进行分页(Page)。当进程访问一个虚拟内存Page而对应的物理内存却不存在时,会触发一次缺页中断(Page Fault),分配物理内存,有需要的话会从磁盘mmap 读入数据。

    通过 App Store 渠道分发的 App,Page Fault 还会进行签名验证,所以一次 Page Fault 的耗时比想象的要多:

    Page Fault
    • 查看 Page Fault

    Instruments -> System Trace

    System Trace Page Fault

    File Backed Page In 即为 Page Fault 的个数

    • 重排
      编译器在生成二进制代码的时候,默认按照链接的 Object File(.o) 顺序写文件,按照 Object File 内部的函数顺序写函数。

    静态库文件.a 就是一组 .o文件的 ar包,可以用 ar -t 查看 .a 包含的所有 .o

    默认布局

    问题分析:假设我们只有两个 page:page1/page2,其中绿色的method1 和 method3 启动时候需要调用,为了执行对应的代码,系统必须进行两个 Page Fault。

    但如果我们把 method1 和 method3 排布到一起,那么只需要一个Page Fault 即可,这就是二进制文件重排的核心原理。

    重排之后

    LinkMap

    LinkMap 是iOS编译过程的中间产物,记录了二进制文件的布局,需要在Xcode的Build Settings里开启Write Link Map File:

    LinkMap

    Path to Link Map File:
    选中编译后的 app,Show In Finder -- 找到build目录 -- 具体路径如下:
    Build/Intermediates.noindex/Spirit.build/Debug-iphonesimulator/Spirit.build/Spirit-LinkMap-normal-x86_64.txt

    LinkMap 主要包括三大部分:

    • Object Files 生成二进制用到的link单元的路径和文件编号
    • Sections 记录Mach-O每个Segment/section的地址范围
    • Symbols 按顺序记录每个符号的地址范围

    ld

    Xcode 使用的链接器件是ld,ld有一个不常用的参数 -order_fileorder_file 中的符号会按照顺序排列在对应section的开始

    Clang 插桩获取启动调用的函数符号

    Clang官方文档

    • LLVM支持我们在添加编译选项 -fsanitize-coverage=trace-pc-guard 的时候,编译时帮我们在函数中插入__sanitizer_cov_trace_pc_guard,当函数调用的时候,会callq__sanitizer_cov_trace_pc_guard

    • 利用 __builtin_return_address(0) 来获得当前函数返回地址,也就是调用方的地址。

    • 通过 dladdr 来将指针解析成 Dl_info 结构体信息,其中dli_sname 就是符号的名称

    Build Settings:

    在App 的 Target - Build Settings - Other C Flags Debug 添加 -fsanitize-coverage=func,trace-pc-guard

    OC - Swift 混编,则在 Other Swift Flags Debug 添加 -sanitize-coverage=func-sanitize=undefined

    Cocoapods 管理代码,用的是静态库的方式的话,那么可以通过hook来修改所有的pod库的编译选项;将以下内容拷贝到你的Podfile文件下面,执行 pod install --no-repo-update

    post_install do |installer|
      installer.pods_project.targets.each do |target|
        target.build_configurations.each do |config|
          macho_type = config.build_settings['MACH_O_TYPE']
          #if macho_type == 'staticlib'
            # 将依赖的 pod 项目的 Other C Flags 加上 '-fsanitize-coverage=func,trace-pc-guard' 选项
            config.build_settings['OTHER_CFLAGS'] ||= ['$(inherited)', '-fsanitize-coverage=func,trace-pc-guard']
            config.build_settings['OTHER_SWIFT_FLAGS'] ||= ['$(inherited)', '-fsanitize-coverage=func,trace-pc-guard']
          #end
        end
      end
    end
    

    获取 APP 启动调用的函数符号:

    • 集成工具:
    pod 'ClangTrace', :git => 'https://github.com/huipengo/ClangTrace.git', :configurations => ['Debug']
    

    会在app的沙盒的tmp目录下生成 trace.order 文件

    真机获取 order 文件

    • Xcoode 选择 Window -> Devices And Simulators -> Devices
    • INSTALLED APPS -> ClangTrace -> Download Container
    Download Container

    Xcode 的连接器 ld 默认忽略 order file不存在的方法
    如果在 Other Linker Flags: Debug 中添加-order_file_statistics,会以 warning 的形式把这些没找到的符号打印在日志里

    设置 order file

    Xcode 项目选择 TARGETS -> Build Settings -> Order File 填写 order file 路径 $(SRCROOT)/trace.order

    Order File

    PS:配置好 order file 之后,记得清理前面 Build SettingsPodfile 中与 Clang 相关的配置

    报如下错:

    ld: library not found for -lClangTrace
    clang: error: linker command failed with exit code 1 (use -v to see invocation)
    

    解决办法:删除如下标记

    image.png image.png

    参考:观看逻辑教育hank老师的启动优化视频整理记录下
    抖音研发实践:基于二进制文件重排的解决方案 APP启动速度提升超15%

    相关文章

      网友评论

          本文标题:iOS App 启动优化 - 二进制重排

          本文链接:https://www.haomeiwen.com/subject/nezwwhtx.html