美文网首页Android开发经验谈Android开发
ART、OAT格式介绍与dex文件提取

ART、OAT格式介绍与dex文件提取

作者: 十八砖 | 来源:发表于2019-07-31 11:34 被阅读3次

    dex文件经过dex2oat编译,会生成.art、.oat两个文件,oat是一个android定制的elf文件,原始dex也保存在其中。8.0后,dex单独保存到.vdex文件中。art文件类似于一个内存映像,缓存常用的ArtField、ArtMethod、DexCache等内容,加载后可直接使用,避免解析耗时。

    art文件格式介绍

    以boot.art为例,它分为Image Section和Bitmap Section区域。每个Section在文件中的偏移量和大小由ImageSection类来描述。
    主要Section介绍:

    • Object Section:存储的一个个的mirror Object对象。需要这个Object对象时,从art文件里读出来(反序列化)即可。Object Section前200个字节保存的是art文件头ImageHeader内容。
    • ArtField和ArtMethod Section:ArtField和ArtMethod对象的内容。
    • DexCacheArrays Section:DexCache有关,通过DexCacheArraysLayout将一个DexCache对象所关联的GcRoot<Class>数组、ArtMethod数组、ArtFiled数组、GcRoot<String>数组按顺序存储在该Section中。
    • ClassTable Section:存储的是一个ClassTable对象的内容。

    Bitmap Section:
    Bitmap区域是一个位图,用于描述Object Section里各个Object的地址,以8字节对齐。如果一个比特位的值为1,则它指向Object Section中的一个Object对象。
    假设Object存储的基地址是0x70000000,如果位图第N个比特位为1,那么这个比特位指向的Object对象地址为0x70000000+N*8。

    art/runtime/image.h:

    oat文件格式介绍

    oat文件本质上是一个ELF文件,它将OAT文件格式内嵌在ELF文件里。
    在oat文件的dymanic section中,导出了三个符号oatdata、oatexec和oatlastword,分别用来描述oatdata和oatexec段加载到内存后的起止地址。


    oatdata段中,包含原dex文件的完整内容(8.0后在.vdex文件),dex文件里面的类方法所对应的本地机器指令保存在oatexec段中。
    OAT主要内容介绍:

    • OatHeader:头信息,vedx的加载地址也在这里记录。
    • OatDexFile:包含一到多个OatDexFile,写入时借助oat_writer.cc OatWriter::OatDexFile类,而读取时转换为oat_file.h中定义的OatDexFile类实例。
    • DexFile:包含一个到多个DexFile项(8.0后独立到vdex文件中)。
    • ClassOffsets:数组,与dex文件一一对应。ClassOffsets[x]代表第x个dex文件,ClassOffsets[x][y]则代表第x个dex文件中的第y个类的信息。
    • OatClass:每个类对应一个OatClass,ClassOffsets[x][y]表示第x个dex中第y个class信息,指向oatclass[y]。OatClass中method_offset_是一个数组,只有一个成员变量code_offset_指向OatQuickMethodHeader中的code_数组。
    • OatMethod:包含一个到多个OatQuickMethodHeader元素。OatQuickMethodHeader中的code_数组指向机器码。

    vdex格式:

    art、oat、vdex三个文件的关系

    boot.art、boot.oat、boot.vdex三者是一体的,相互依赖。

    • ImageHeader中有成员变量关联到oat文件。oat_file_begin_指向oat文件加载到内存的地址,oat_data_begin_指向符号oatdata的值,oat_data_end_指向符号oatlastword的值。
    • art文件里的ArtMethod对象的entry_point_from_quick_compiled_code_指向位于oat文件对应的code_数组。

    zygote启动创建Heap的时候,会加载boot.art,然后加载boot.oat,再然后加载boot.vdex。
    调用流程如下:

    Heap::Heap()
        space::ImageSpace::LoadBootImage()
            ImageSpace::CreateBootImage()
                ImageSpaceLoader::Load()
                    ImageSpaceLoader::Init()
                        LoadImageFile()//加载art文件
                            MemMap::MapFileAtAddress(..., image_filename);
                        OpenOatFile()
                            OatFile::Open()
                                OatFileBase::OpenOatFile<ElfOatFile>(..., vdex_fd)//加载oat文件
                                    LoadVdex()
                                        VdexFile::OpenAtAddress()//加载vdex文件
                                            OpenAllDexFiles()//加载dex文件
    

    提取dex

    dextra
    vdexExtractor
    compact_dex_converter
    Android 9(Pie)推出了一种新型Dex文件,即Compact Dex(Cdex)。Cdex是一种ART内部文件格式,它压缩各种Dex数据结构(例如方法头)并对多索引文件中的常见数据blob(例如字符串)进行重复数据删除。来自输入应用程序的Dex文件的重复数据删除数据存储在Vdex容器的共享部分中。
    由于Vdex容器存储的是Cdex文件而不是标准的Dex,因此需要借助compact_dex_converter工具来实现提取dex。

    安装提取工具步骤(ubuntu):

    1. git clone https://github.com/anestisb/vdexExtractor.git
    2. ./make.sh
    3. 下载compact_dex_converter解压到vdexExtractor/bin下
    4. 下载解压dextra即可直接使用

    提取:(工具并不完美,提取dex后有些不能正常jadx反编译)

    1. android5、6、7:./dextra.ELF64 -dextract boot-framework.oat
    2. android8:./bin/vdexExtractor -i mydex/8/services.vdex -o mydex/out8/,"failed to unquicken Dex file"则加上--no-unquicken
    3. android9:./bin/vdexExtractor -i mydex/9/services.vdex -o mydex/out9/
      ./bin/compact_dex_converters -w mydex/out9/ mydex/out9/services_classes.cdex
      将生成的cdex.new改名为xxx.dex即可使用jadx反编译。(如果无法反编译,升级jadx或者修改dex头版本信息039-->035)

    相关文章

      网友评论

        本文标题:ART、OAT格式介绍与dex文件提取

        本文链接:https://www.haomeiwen.com/subject/dlgvrctx.html