Mach-O

作者: 大冯宇宙 | 来源:发表于2019-12-06 16:47 被阅读0次

    Mach-O是什么?

    Mach-O是Mach object的缩写,是Mac、iOS上用于存储程序、库的标准格式。像iOS的App的可执行文件,就是Mach-O格式

    为什么要了解Mach-O?

    一是知识储备,用来面试,或者写出更好的代码。

    二是实际用途,比如我想去破解别人app,我想知道别人的APP有哪些东西,只有充分了解了这些,才能往他内存当中去注入一些代码。比如说我知道了他的数据段在哪个地方,我才知道可以修改的数据在哪里。或者我知道了他的动态库信息在哪个地方,我就可以修改动态库符号表的信息,就可以链接我自己的一个动态库,注入一些新的动态库。

    属于Mach-O格式的文件类型

    这些东西可以从苹果源码里查,或者从XNU里查,XNU就是mac系统的内核。(https://opensource.apple.com/tarballs/xnu

    • EXTERNAL_HEADERS/Mach-o/fat.h
    • EXTERNAL_HEADERS/mach-o/loader.h
    常见的Mach-O文件类型

    MH_OBJECT

    • 目标文件(.o)。

    我们可以简单的创建一个.c文件,生成目标文件后,使用file命令可以看到test.o就是Mach-O的格式。

    //编写代码保存为test.c
    #include<stdio.h>
    int main() {
     printf("test--");
     return 0;
    }
    //命令行下可以看到Mach-O的文件格式
    clang -c test.c 
    file test.o 
    test.o: Mach-O 64-bit object x86_64
    
    • 静态库文件(.a),静态库文件就是若干个.o合并在一起。

    • MH_EXECUTE 可执行文件

    • MH_DYLIB:动态库文件

    • .dylib

    • .framework/xx

    • MH_DYLINKER:动态连接器文件

    • /usr/lib/dyld

    • MH_DSYM:储存着二进制文件符号信息的文件

    • .dSYM/Contents/Resources/DWARF/xx (常用于分析APP的崩溃信息)

    • 通用二进制文件

    • 同时适用于多重架构的二进制文件
      包含了多重不同架构的独立的二进制文件
      因为需要存储多种架构的代码,通用二进制文件通常比单一的二进制文件要大
      由于两种架构有共同的一些资源,所以并不会达到单一版本的两倍多
      由于执行过程中,只调用一部分代码,运行起来也不需要额外的内存
      因为文件比原来的要大,也成为胖二进制文件。

    Mach-o的结构

    官方描述:


    一个Mach-O文件包含3个主要区域

    • Header
      文件类型(比如静态库、动态库、可执行文件等等)、目标架构类型(arm64)、等

    • Load commands
      描述文件在虚拟内存中的逻辑结构、布局
      我们平时说的内存,都是虚拟内存,比如我们再内存中创建个对象
      我们都知道程序在内存中,都是段结构,比如数据段,代码段,Load commands就是描述将来程序有哪些段,每个段有多大,里边大概有什么信息

    • Raw segment data
      在Load commands中定义的Segment的原始数据。上边提到的Load commands是提供了段的描述信息,而这个Row segment data就代表段里的具体数据。

    其实这个Mach-O就相当于一本书,Header就相当于一本书的绪,开头标题。Load commands就相当于一本书的目录,告诉了你每一个段从哪里开始,到哪里结束。Data就相当于一本书的内容。

    Header

    在读取整个mach-o文件的时候,首先被解析的就是这个Header文件。通过header然后去加载.



    Load commands
    窥探Mach-O的结构
    • 命令行工具

    file: 查看Mach-O的文件结构

    ➜ **Desktop** file Zeus 
    Zeus: Mach-O 64-bit executable arm64
    
    • otool:查看Mach-O特定部分和段的内容
    ➜ **Desktop** otool 
    
    -f print the fat headers //打印胖二进制文件的头信息
    
    -a print the archive header
    
    -h print the mach header // 打印mach文件的头信息,实际上就是打印armv7 arm64二进制文件的头信息
    
    -l print the load commands
    
    -L print shared libraries used //打印依赖的framework
    
    -D print shared library id name
    
    -t print the text section (disassemble with -v)
    
    • lipo:常用于多架构Mach-O文件的处理

    • 查看架构信息:lipo -info 文件路径

    • 导出某种特定架构:lipo 文件路径 -thin 架构类型 -output 输出文件路径

    • 合并多种架构:lipo 文件路径1 文件路径2 -output 输出文件路径

    GUI工具

    MachOView (https://github.com/gdbinit/MachOView)

    dyld和mach-o

    dyld 也是Mach-O文件,加载以下类型的Mach-O文件

    MH_EXECUTE - 可执行文件

    MH_DYLIB - 动态库文件

    MH_BUNDLE

    总结一下,Mach-O组成
    • 首先是一个胖二进制文件的标记,如果是多种架构的就是胖二进制文件。从app store下载时候,会根据当前手机机型下载相应的二进制文件,但是从本地上传到商店的时候,上传的就是一个胖的二进制文件,因为需要适应不同架构的手机安装。

    • 接下来就是二进制文件的头信息

    • 二进制文件的段信息

    • 二进制文件的每个段代表的具体信息。

    我们平时常用的反编译软件,其实就是解析了这个mach-o文件,以可视化的方式呈现。

    相关文章

      网友评论

          本文标题:Mach-O

          本文链接:https://www.haomeiwen.com/subject/owysgctx.html