ipa包主要由三大部分构成:
1、可执行文件;2、Asset.car 文件(asset 文件夹中图片的压缩文件);3、其他:_CodeSignature文件夹,签名信息。
Unix 可执行文件-20.8 MB
- 使用 file 命令查看这个可执行文件:这是个 Mach-O 文件类型,里面包含了两个架构:armv7&arm64。
file DingTalk
- 使用otool查看Mach-O文件:
otool -h DingTalk
。使用反汇编工具对执行文件进行反汇编可以对Mach-O文件有一个直观的认识。
Mach-O:
Mach-O为Mach Object 文件格式的缩写,它是一种用于可执行文件,目标代码,动态库,内核转储的文件格式。
是iOS/Mac OS上存储程序以及库的标准格式。
- 常见的Mach-O格式的文件
- MH_OBJECT 目标文件:
.o
.a/
.framework静态库
,静态库即多个.o文件存放在一起实现特定的功能。 - MH_EXECUTE 可执行文件:
.app/MyApp
.out
- MH_DYLIB 动态库:
.framework/xxx
/dylib
- MH_DYLINKER 动态链接器:
usr/lib/dyld
- MH_DSYM 存储二进制文件符号信息的文件:
.dYSM/Contents/Resources/DWARF/MyApp
- MH_OBJECT 目标文件:
- Mach-O文件的基本结构
- 头部(header structure):文件类型, 目标架构。
- 加载命令(load command):描述文件在虚拟内存中的逻辑与布局。
- 段(segment)。可以拥有多个段(segment),每个段可以拥有零个或多个区域(section)。每一个段(segment)都拥有一段虚拟地址映射到进程的地址空间。加载命令中定义的原始数据。
- 链接信息。一个完整的用户级 Mach-o 文件的末端是链接信息。其中包含了动态加载器用来链接可执行文件或者依赖库所需使用的符号表、字符串表等等。
- 分析Mach-O结构
Mach Header(arm64)
Magic Number : 魔数, 表示支持设备的CPU位数(oxFEEDFACE : 表示32位二进制、oxFEEDFACF : 表示64位二进制)
cputype和 cpusubtype: CPU类型和子类型
filetype : Mach-O文件类型
ncmds 和 sizeofcmds: 用于加载器的 加载命令的条数和大小
flags : 动态链接器dyld的标志
基本的编译过程分为四个步骤:
- 预处理(Pre-process):把宏替换,删除注释,展开头文件,产生 .i 文件。
- 编译(Compliling):使用预处理后的单词构建词法树,生成语法树输出 AST(Abstract Syntax Tree),将 AST 转化为更低级的中间码(LLVM IR),优化中间代码生成输出汇编代码,把之前的 .i 文件转换为汇编语言,产生 .s 文件。
- 汇编(Asembly):把汇编语言文件转换为机器码文件,产生 .o 文件。
- 链接(Link):对 .o 文件中的对于其他的库的引用的地方进行引用,生成最后的可执行文件(同时也包括多个.o文件进行 link)。
LinkMap
LinkMap中存放的是app可执行文件Mach-O格式组织的各类数据的清单,根据LinkMap展开对Mach-O文件及dyld加载Mach-O可执行文件的细节;
LinkMap文件是xcode link时产生的中间文件,一般用于调试,可以精确知道某个地址对应的函数。
iOS APP编译后,除了一些资源文件,剩下的就是一个可执行文件。
1.XCode开启编译选项Write Link Map File
2.编译后,到编译目录里找到该txt文件,文件名和路径就是上述的Path to Link Map File
这个LinkMap里展示了整个可执行文件的全貌,列出了编译后的每一个.o目标文件的信息(包括静态链接库.a里的),以及每一个目标文件的代码段,数据段存储详情。
1
目标文件列表,中括号里的是这个文件的编号。
2
段表:首列是数据在文件的偏移位置,第二列是这一段占用大小,第三列是段类型,代码段和数据段,第四列是段名称。第一行位置+大小 = 第二行位置。
__text表示编译后的程序执行语句
__data表示已初始化的全局变量和局部静态变量
__bss表示未初始化的全局变量和局部静态变量
__cstring表示代码里的字符串常量
以下是__TEXT段的section
__text 主程序代码
__stubs 和__stub_helper 用于动态链接库的stub
__cstring c语言字符串
__const const修饰的常量
__objc_methname objc的方法名称
__objc_methtype objc方法类型
__objc_classname objc类方法
以下是__DATA段的section
__objc_ivars objc类的实例变量
__objc_classlist objc类列表
__objc_protolist objc协议列表
__objc_imageinfo objc镜像信息
__objc_const objc常量
__objc_selfrefs objc自引用(self)
__objc_protorefs objc协议引用
__objc_superrefs objc超类引用
__cfstring 使用Core Foundation字符串
__bss BSS
3
接着就是按上表顺序,列出具体的按每个文件列出每个对应字段的位置和占用空间。
首列是数据在文件的偏移地址,第二列是占用大小,第三列是所属文件序号,对应上述Object files列表,最后是名字。
4
// 已废弃&多余重复的字段
# Dead Stripped Symbols:
自动分析LinkMapParser
网友评论