Mach-O

作者: 浅墨入画 | 来源:发表于2021-02-08 21:09 被阅读0次

    前言:

         Mach-O(Mach Object)是macOS、iOS、iPadOS存储程序和库的文件格式。对应系统通过应用二进制接口(application binary interface,缩写为ABI)来运行该格式的文件。Mach-O格式用来替代BSD系统的a.out格式。Mach-O文件格式保存了在编译过程和链接过程中产生的机器代码和数据,从而为静态链接和动态链接的代码提供了单一文件格式。

    MachO格式的常见文件有:

    \cdot 目标文件.o

    \cdot 库文件 .a静态库 .dylib动态库 .framework文件

    \cdot 二进制可执行文件 dyld动态链接器将依赖的动态库加载到内存 .dsym符号表

    可执行文件调用过程

    1. 调用`fork`函数,创建一个`process`

    2. 调用`execve`或其衍生函数,在该进程上加载,执行我们的`Mach-O`文件

    当我们调用时`execve`(程序加载器),内核实际上在执行以下操作:

        \cdot 将文件加载到内存

        \cdot 开始分析`Mach-O`中的`mach_header`,以确认它是有效的`Mach-O`文件

    一. Mach-O文件结构

    image.png

    1. 查看MachO Headers

    // 查看 Header,包括 Load commands

    $ objdump --macho --private-headers LoginApp

    $ otool -l ${MACHO_PATH}

    // 只查看 Header 

    $ objdump --macho --private-header LoginApp 

    $ otool -h ${MACHO_PATH}

    image.png image.png

    // 查看 __TEXT只读代码段  iOS7/8 苹果限制 text代码段为60M,现在放宽到500M

    $ objdump --macho -d ${MACHO_PATH}

    image.png

    \color{red}{\mathtt{Mach-O}}中定义了程序的入口\color{red}{\mathtt{main}}函数(定义在LC_MAIN的Load command命令),告诉动态链接器去加载程序的入口

    // grep代表搜索, -A 5:向下输出5行 

    $ objdump --macho --private-headers LoginApp | grep "MAIN" -A 5

    image.png

    2.使用machoinfo工具查看MachO Headers简洁版

    第一种使用方法:首先对machoinfo进行编译,生成一个查看MachO的文件,使用该文件查看其他MachO Headers信息,命令如下

    $ ./machoinfo ${MACHO_PATH}

    image.png

    第二种使用方法:Edit Scheme 配置要查看的MachO文件路径,如下所示

    被查看的MachO文件作为参数传入程序入口 int main(int argc,char *argv[]) 

    image.png

    配置完成之后,运行machoinfo工程,macho信息打印在Xcode 控制台

    二. 符号表

    \cdot  Symbol Table:就是用来保存符号。

    \cdot  String Table:就是用来保存符号的名称。

    \cdot  Indirect Symbol Table:间接符号表。保存使用的外部符号。更准确一点就是使 用的外部动态库的符号。是Symbol Table的子集。

    2.1 Xcode 脚本输出重定位到终端

    image.png image.png image.png image.png

    2.2全局符号和本地符号

    我们在main函数上定义一个全局变量和一个静态变量

    #import <Foundation/Foundation.h>

    int global_init_value = 10;

    static int static_init_value = 9;

    int main(int argc, char *argv[]) {  return 0;  }

    查看符号表命令

    $ objdump --macho --syms ${MACH_PATH}

    image.png

    可以看出全局变量是全局符号,静态全局变量是本地符号。怎么把全局符号变成本地符号呢?

    //定义成全局变量

    extern int hidden_y;

    extern double default_y;

    extern double protected_y;

    int hidden_y __attribute__((visibility("hidden"))) = 99; //全局符号变成本地符号double default_y __attribute__((visibility("default"))) = 100;//defalut不改变符号状态

    visibility属性,控制文件导出符号,限制符号可见性

    -fvisibility:clang参数

    default:用它定义的符号将被导出。

    hidden:用它定义的符号将不被导出。

    全局符号对整个项目可见,对引用这个项目的工程也可见;本地符号只对当前文件可见

    如果我们在一个库的m文件中实现一个全局的global_object函数,我们可以在项目中通过extern void  global_object()之后正常使用,但是如果我们项目中也实现global_object函数,代码会优先调用本项目中的global_object方法,这里涉及到命名空间

    two_levelnamespace & flat_namespace:

    二级命名空间与一级命名空间。链接器默认采用二级命名空间,也就是除了会记录符号 名称,还会记录符号属于哪个Mach-O的,比如会记录下来_NSLog来自Foundation。

    2.3导出符号

    我们在main中使用NSLog,可知NSLog对于Foundation是导出符号,NSLog对于我们的项目是导入符号

    查看导出符号命令

    $ objdump --macho --exports-trie ${MACH_PATH}

    image.png

    可以看出我们的导出符号也就是我们的全局符号。

    2.4间接符号表

    间接符号表是我们使用的其他动态库的符号。

    查看间接符号表命令

    $ objdump --macho --indirect-symbols ${MACH_PATH}

    image.png

    我们strip的话,剥离本地符号,全局符号也就是导出符号不能被剥离。

    2.5OC类是导出符号

    OC是一门动态语言,默认是导出符号,所以可以根据符号来恢复符号表。

    我们创建OC类,查看OC类和方法是本地符号还是全局符号(导出符号)

    image.png

    我们创建的oc类都是导出符号,如果我们不想让我们的类作为导出符号被外界使用,我们可修改link配置,隐藏导出符号

    配置other linker flag参数如下

    OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_CLASS_$_LGOneObject

    OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_METACLASS_$_LGOneObject

    重新查看导出符号如下图

    image.png

    配置other linker flag参数做一些其他操作

    //  剥离符号命令

    OTHER_LDFLAGS=$(inherited) -Xlinker -S

    // 多个OC类 可以使用  -unexported_symbol_list

    OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol_list -Xlinker _OBJC_CLASS_$_LGOneObject

    //  -map 导出一些符号信息以及链接的其他库信息 

    OTHER_LDFLAGS=$(inherited) -Xlinker -S -Xlinker -map -Xlinker /Users/wangning/Desktop/Symbol.text

    2.6弱引用符号与弱定义符号 

    Weak Symbol:

        \cdot  Weak Reference Symbol: 表示此未定义符号是弱引用。如果动态链接器找不

    到该符号的定义,则将其设置为0。链接器会将此符号设置弱链接标志。

        \cdot  Weak defintion Symbol: 表示此符号为弱定义符号。如果静态链接器或动态链

    接器为此符号找到另一个(非弱)定义,则弱定义将被忽略。只能将合并部分中的符号标

    记为弱定义。

    //  弱引用

    void weak_import_function(void) __attribute__((weak_import));

    // 弱定义

    void weak_function(void)  __attribute__((weak));

    把一个全局符号定义成 弱定义符号,并不影响它是一个导出符号

    image.png

    // -U 表示 弱引用符号 _weak_import_function  动态链接时候不用管

    OTHER_LDFLAGS=$(inherited) -Xlinker -U -Xlinker _weak_import_function

    2.7未定义符号

    common符号,未初始化的全局符号,当找到定义的全局符号之后,会把未定义的符号删除,所以重复定义并不会报错

    链接的时候会把一个未定义符号强制成定义符号,类似于弱定义符号

    NSLog对当前使用的可执行文件来说是一个未定义符号

    image.png

    2.8间接符号表

    间接符号表起别名,可以让引用的库文件提供给其他库使用

    // -alias  给间接符号表起别名

    OTHER_LDFLAGS=$(inherited) -Xlinker -alias -Xlinker _NSLog -Xlinker Cat_NSLog

    image.png

    Cat_NSLog作为重新导出符号提供给外部使用

    image.png

    2.9重定位符号表

    重定位符号就是我们在调用别人的api时,在编译的时候需要记录一下放到重定位符号表中。重定位符号表里存放当前用到的符号,可以检测重定位符号表来查看.o文件中对某个api的使用情况

    // 查看目标文件o的重定位

    $ objdump --macho --reloc test.o

    image.png image.png

    2.10Swift符号表

    Swift 作为一门静态语言,其符号相关查看

    image.png image.png

    总结:

    macho文件是可读可写的,strip命令 可以修改macho的内容,也就是符号剥离。

    Xcode中的断点也是可以读写到文件中,断点写入文件后,在文件中可以查看断点的绝对路径等相关信息

    br read -f ${PATH}  // 读取文件中的断点

    br write -f ${PATH} // 断点写入文件

    br list strip

    br enable strip

    相关文章

      网友评论

          本文标题:Mach-O

          本文链接:https://www.haomeiwen.com/subject/vwestltx.html