6.MachO

作者: JoyChenSeven | 来源:发表于2019-11-12 16:50 被阅读0次


    MachO文件

    MachO文件

    MachO文件结构

    DYLD

    Mach-O其实是Mach Object文件格式的缩写,是mac以及iOS上可执行文件的格式,类似于windows上的PE格式 (Portable Executable ), linux上的elf格式 (Executable and Linking Format)

    Mach-O文件格式

    1、Mach-O为Mach object文件格式的缩写,它是一种用于可执行文件、目标代码、动态库的文件格式。作为a.out格式的替代,Mach-O提供了更强的扩展性。

    2、属于MachO格式的常见文件

    •目标文件.o

    •库文件

    •.a

    •.dylib

    •Framework

    •可执行文件

    •dyld

    •.dsym

    3、File指令

    •通过$file 文件路径

    查看文件类型

    例子:

    $ vim test.c

    $ clang -c test.c  (生成 .o文件)

    $ file test.o  ( test.o: Mach-O 64-bit object x86_64 ,可以看到test.o 的类型)

    $ clang test.o

    那么a.out 与 test.o 有什么区别呢?

    如果有多个文件的话,每一个源文件都会编译出对应的.o文件,多个.o文件链接成一个可执行文件。

    XCode debug模式编译调试到真机上的app是单一架构,比如iPhone X 是arm 64架构的。release 模式编译的话,如果支持的低版本的系统的话,会有多个架构。

    arm v7 、 arm v7s (5s) 都是32位的, arm 64 、arm 64e 都是64 位的。

    标红部分为当前架构,是个环境变量

    是否值编译当前架构,debug时只编译当前架构,release 时编译所有架构。

    这里的架构会比我们编译出来的架构多,那是因为编译会选择 valid 和 architectures的焦交集,如果想编译出更多的架构,可以手动添加,比如添加armv7s

    通用二进制文件(Universal binary)

    - 苹果公司提出的一种程序代码。能同时适用多种架构的二进制文件

    - 同一个程序包中同时为多种架构提供最理想的性能。

    - 因为需要储存多种代码,通用二进制应用程序通常比单一平台二进制的程序要大。

    - 但是 由于两种架构有共通的非执行资源,所以并不会达到单一版本的两倍之多。

    - 而且由于执行中只调用一部分代码,运行起来也不需要额外的内存。

    通用二进制文件、胖二进制文件(fat binary)

    lipo命令

    1、使用lifo-info 可以查看MachO文件包含的架构

     $ lipo-info MachO文件

    2、使用lifo–thin拆分某种架构

     $ lipoMachO文件 –thin 架构 –output输出文件路径

    3、使用lipo-create  合并多种架构

    $ lipo-create MachO1   MachO2  -output 输出文件路径

    1、拆分

    2、合并

    拆分和合并的源machO 是一样的。md5是一样的。

    拆分出来的单一架构的machO 文件大小之和与合并后的machO文件大小之和是不一样的,有可能合并后的大于单一的总和,代码是不共用的,资源是公用的。

    MachO文件结构

    Mach-O 的组成结构如图所示包括了

    •Header 包含该二进制文件的一般信息

         •字节顺序、架构类型、加载指令的数量等。

         •使得可以快速确认一些信息,比如当前文件用于32位还是64位,对应的处理器是什么、文件类型是什么

    •Load commands 一张包含很多内容的表

          •内容包括区域的位置、符号表、动态符号表等。

    •Data 通常是对象文件中最大的部分

          •包含Segement的具体数据

    如果是fat binary 胖二进制文件的话,是一个fat header,然后是不同的架构的executable叠在一起,打开每一个executable将是Mach Header、Load commands 和 Data 数据。

    也可以通过otool 工具查看二进制文件, $ otool 查看指令

    $ otool -f MachO  (查看header信息)

    Data段中包含:符号表、类名称、方法名称、属性、常量、

    Load commands段: 代码段、数据段size、link、需要的三方库

    手机加载过程中只会加载对应架构的machO文件,file offset是相当于当前的machO的地址的偏移。

    从下面两张图可以看出,cpu读整个文件从push {r7,lr} 开始的。

    Header的数据结构

    查看 command + shift + o  搜索 loader 

    file type 类型有以下文件类型

    mach header 后面的4个字节就是load commands开始了

    weak binding 弱绑定的数据,lazy binding 懒绑定的数据

    比如调用 NSLog 函数, dyld 实现 函数与符号之间的绑定

    如果定义的静态字符串,是在运行的时候确定地址的。每个mach-o创建的静态区在运行时不在mach-o中,在静态区。

    符号表中的符号是存在于数据段,可以共用。比如objc_msgSend 只有在使用的时候进行符号绑定。

    PIC技术,位置代码独立。

    总结:

    - machO是一种文件格式

        -包含:可执行文件、动态库、静态库、目标文件、dyld等 

              - 可执行文件

              -查看某个文件:file

             -通用二进制文件,多种架构,可以在多种架构上运行

        - lipo命令

               - thin 可以拆分架构

              - creat 合并架构

    -  machO结构

        - Header 

             - 用于快速确认文件:cpu类型、文件类型

     - LoadCommands

            - 用于指示加载器如何加载我们的二进制文件,依赖那些三方、系统的库

      - Data

          - 存放数据:代码、字符串常量、类、方法等

    header 紧紧链接着 LoadCommands ,但是 LoadCommands 与Data 之间有很大一段空间。

    相关文章

      网友评论

          本文标题:6.MachO

          本文链接:https://www.haomeiwen.com/subject/rqlsvctx.html