Clang插桩

作者: 浅墨入画 | 来源:发表于2021-10-21 23:49 被阅读0次

配置Clang插桩

LLVM内置了一个简单的代码覆盖率检测工具(SanitizerCoverage)。它在函数级基本块级边缘级上插入对用户定义函数的调用,通过这种方式可以顺利对OC方法C函数BlockSwift的方法/函数进行全面HOOK

Clang13的文档 关于 Tracing PCs (跟踪CPU执行到的代码),通过Clang插桩我们可以跟踪到所有函数的执行,包括APP启动时刻所调用的

Clang 插桩
  • 搭建测试项目,在Build Setting -> Other C Flags中,增加-fsanitize-coverage=trace-pc-guard的配置
image.png
  • 编译工程有如下报错
image.png

说明__sanitizer_cov_trace_pc_guard_init__sanitizer_cov_trace_pc_guard方法需要我们实现,Clang13的官方文档内容如下

image.png
  • 按照文档,在项目中加入如下代码
#import "ViewController.h" 
#include <stdint.h> 
#include <stdio.h> 
#include <sanitizer/coverage_interface.h>
@implementation ViewController

- (void)viewDidLoad {
    [super viewDidLoad];
 }

void __sanitizer_cov_trace_pc_guard_init(uint32_t *start, uint32_t *stop) { 
    static uint64_t N; 
    if (start == stop || *start) return; 
    printf("INIT: %p %p\n", start, stop); 
    for (uint32_t *x = start; x < stop; x++) 
        *x = ++N; 
}

void __sanitizer_cov_trace_pc_guard(uint32_t *guard) {
    if (!*guard) return;
    void *PC = __builtin_return_address(0); 
    char PcDescr[1024]; 
    printf("guard: %p %x PC %s\n", guard, *guard, PcDescr); 
}

@end
__sanitizer_cov_trace_pc_guard_init函数

参数一 start是一个指针,指向无符号int类型4个字节,相当于一个数组的起始位置,即符号的起始位置(是从高位往低位读)
参数二 stop由于数据的地址是往下读的(即从高往低读,所以此时获取的地址并不是stop真正的地址,而是标记的最后的地址,读取stop时由于stop占4个字节,stop真实地址 = stop打印的地址-0x4

// 运行项目,打印以下内容:
INIT: 0x10e838a0c 0x10e838aa0
  • 打印来自__sanitizer_cov_trace_pc_guard_init函数
  • 通过for循环代码,发现从startstop的地址中,存储的是uint32_t类型的值
  • 循环中xuint32_t指针类型,x++表示指针运算,步长+1会增加数据类型的长度
  • uint32_t占4字节,所以循环中的代码含义,每四字节记录一个++N的值
lldb验证

// 读取start 
(lldb) x 0x10e838a0c
0x10e838a0c: 01 00 00 00 02 00 00 00 03 00 00 00 04 00 00 00  ................
0x10e838a1c: 05 00 00 00 06 00 00 00 07 00 00 00 08 00 00 00  ................
// 读取stop 
(lldb) x 0x10e838aa0-4
0x10e838a9c: 25 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00  %...............
0x10e838aac: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00  ................
  • 读取最后一个值,要在stop地址的基础上减去4字节
  • startstop,读出值为25(注意是16进制)表示当前项目中方法/函数/Block的符号个数。
__sanitizer_cov_trace_pc_guard函数

参数guard是一个哨兵,告诉我们是第几个方法被调用的

  • __sanitizer_cov_trace_pc_guard函数中设置断点,运行项目查看函数调用栈,由main函数调用
image.png
  • 继续调试,进入该函数的断点,由didFinishLaunchingWithOptions函数调用
image.png

我们发现项目中每一个方法和函数的调用,都会触发__sanitizer_cov_trace_pc_guard的断点,并且由当前执行的方法/函数调用

测试__sanitizer_cov_trace_pc_guard方法

void __sanitizer_cov_trace_pc_guard(uint32_t *guard) { 
    NSLog(@"__sanitizer_cov_trace_pc_guard");
}

- (void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event { 
    NSLog(@"touchesBegan方法执行"); 
    test(); 
}

void(^block)(void) = ^(void) { 
    NSLog(@"Block执行");
};

void test() { 
    NSLog(@"test函数执行");
    block();
}

// 控制台打印
2021-10-20 20:57:20.938427+0800 TraceDemo[16078:2734157] __sanitizer_cov_trace_pc_guard
2021-10-20 20:57:20.940051+0800 TraceDemo[16078:2734157] touchesBegan方法执行
2021-10-20 20:57:20.940299+0800 TraceDemo[16078:2734157] __sanitizer_cov_trace_pc_guard
2021-10-20 20:57:20.940499+0800 TraceDemo[16078:2734157] test函数执行
2021-10-20 20:57:20.940675+0800 TraceDemo[16078:2734157] __sanitizer_cov_trace_pc_guard
2021-10-20 20:57:20.940861+0800 TraceDemo[16078:2734157] Block执行
  • 从运行结果来看,方法和函数全部被HOOK
  • 被拦截的方法和函数,仅限当前项目中的符号。例如:NSLog等外部符号不会被HOOK
  • 二进制重排的本意,就是将代码实现的二进制中方法/函数符号在启动时刻按照顺序排列在前面。外部符号的方法/函数实现,并不在当前项目中,所以它们的符号也不在重排的范围之内。

测试set方法能否HOOK到?

@interface ViewController ()
@property(nonatomic, assign) int age;
@end

- (void)viewDidLoad {
    [super viewDidLoad];
    self.age = 10;
}
image.png

set方法成功HOOK

Clang插桩的原理

__sanitizer_cov_trace_pc_guard方法添加断点,点击屏幕触发touchesBegan方法进行调试

image.png

在每一个方法/函数/Block内容执行前,都调用了__sanitizer_cov_trace_pc_guard函数

Clang插桩的实现原理:

  • 只要添加了Clang插桩的标记,编译器就会在当前项目中所有方法函数Block的代码实现边缘,插入一句__sanitizer_cov_trace_pc_guard函数的调用代码,达到方法/函数/Block的100%覆盖
  • 相当于编译器在编译时期,修改了当前的二进制文件
  • 修改时机:有可能是语法分析之后生成IR中间代码时进行修改(未验证)

获取符号名称

我们现在已经能HOOK到所有的方法/函数/Block,现在要怎么获取它们的符号,写入order文件?

  • 查看__builtin_return_address方法
void __sanitizer_cov_trace_pc_guard(uint32_t *guard) {
    if (!*guard) return;
    //获取上一个函数的地址,通过这个地址就能拿到函数的符号名称
    /*
     - PC 当前函数返回上一个调用的地址
     - 0 当前这个函数地址,即当前函数的返回地址
     - 1 当前函数调用者的地址,即上一个函数的返回地址
    */
    void *PC = __builtin_return_address(0); 
    char PcDescr[1024]; 
    printf("guard: %p %x PC %s\n", guard, *guard, PcDescr); 
}
  • 得到调用者的函数地址获取符号名称
#include <dlfcn.h> 

void __sanitizer_cov_trace_pc_guard(uint32_t *guard) { 
    if (!*guard) return; 
    
    void *PC = __builtin_return_address(0);
    Dl_info info; 
    dladdr(PC, &info);
    
    NSLog(@"%s", info.dli_fname); 
    NSLog(@"%p", info.dli_fbase);
    NSLog(@"%s", info.dli_sname);
    NSLog(@"%p", info.dli_saddr); 
}

使用dladdr函数传入函数地址获取基本信息,存入Dl_info结构体

  • Dl_info结构体的定义
typedef struct dl_info {
        const char      *dli_fname;     /* Pathname of shared object */
        void            *dli_fbase;     /* Base address of shared object */
        const char      *dli_sname;     /* Name of nearest symbol */
        void            *dli_saddr;     /* Address of nearest symbol */
} Dl_info;
  • dli_fname:当前MachO路径(文件的名字)
  • dli_fbase:当前MachO起始地址(文件的地址)
  • dli_sname:函数名称
  • dli_saddr:函数地址

运行项目查看打印结果,发现可以通过dli_sname得到函数名称

/Users/wn/Library/Developer/CoreSimulator/Devices/C53887CF-B3AC-4677-B6FD-DD090CC6D346/data/Containers/Bundle/Application/E211EC24-FFD6-4745-8DFE-345A1DDDC07C/TraceDemo.app/TraceDemo
0x10fb8a000
-[ViewController touchesBegan:withEvent:]
0x10fb8dd20
  • 修改测试代码运行项目
#import "ViewController.h"
#include <stdint.h>
#include <stdio.h>
#include <sanitizer/coverage_interface.h>
#include <dlfcn.h>

@interface ViewController ()
@end
@implementation ViewController

+ (void)load {
    // NSLog(@"load函数");
}

- (void)viewDidLoad {
    [super viewDidLoad];
}

void __sanitizer_cov_trace_pc_guard_init(uint32_t *start, uint32_t *stop) {
    static uint64_t N;
    if (start == stop || *start) return;
    
    for (uint32_t *x = start; x < stop; x++)
        *x = ++N;
}

void __sanitizer_cov_trace_pc_guard(uint32_t *guard) {
    void *PC = __builtin_return_address(0);
    Dl_info info;
    dladdr(PC, &info);
    NSLog(@"%s", info.dli_sname);
}

@end

// 控制台打印
 +[ViewController load]
 main
 -[AppDelegate application:didFinishLaunchingWithOptions:]
 -[SceneDelegate window]
 -[SceneDelegate setWindow:]
 -[SceneDelegate window]
 -[SceneDelegate window]
 -[SceneDelegate scene:willConnectToSession:options:]
 -[SceneDelegate window]
 -[SceneDelegate window]
 -[SceneDelegate window]
 -[ViewController viewDidLoad]
 -[SceneDelegate sceneWillEnterForeground:]
 -[SceneDelegate sceneDidBecomeActive:]

获取到启动时刻所有被调用的方法、函数、Block的函数名称。其中部分函数多次调用,出现了重复符号,还需要对其排重。

通过原子队列保存符号

修改代码,测试能否获取到子线程的符号

- (void)viewDidLoad {
    [super viewDidLoad];
    [self performSelectorInBackground:@selector(testSleep) withObject:nil];
}

- (void)testSleep {
    sleep(3);
}

void __sanitizer_cov_trace_pc_guard(uint32_t *guard) {
    void *PC = __builtin_return_address(0);
    NSLog(@"%@", [NSThread currentThread]);
    Dl_info info;
    dladdr(PC, &info);
    NSLog(@"%s", info.dli_sname);
}

// 控制台打印
 -[SceneDelegate sceneDidBecomeActive:]
 <NSThread: 0x6000038a7540>{number = 8, name = (null)}

通过日志可以确定能够获取子线程的符号,同时说明__sanitizer_cov_trace_pc_guard的回调是多线程的。所以当我们通过回调收集函数名称时也要保证线程安全。

  • 以下案例我们使用线程相对安全原子队列进行返回地址的收集
#import <libkern/OSAtomic.h>

//定义原子队列 
static OSQueueHead symbolList = OS_ATOMIC_QUEUE_INIT;

//定义结构体 
typedef struct { 
    void *pc; 
    void *next; 
} SYNode;

void __sanitizer_cov_trace_pc_guard(uint32_t *guard)  {
    void *PC = __builtin_return_address(0);
    //创建结构体
    SYNode *node = malloc(sizeof(SYNode));
    *node = (SYNode){PC, NULL};
    //结构体入栈
    //offsetof:参数1传入类型,将下一个节点的地址返回给参数
    OSAtomicEnqueue(&symbolList, node, offsetof(SYNode, next));
}

// 生成order文件
- (void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event { 
    while (YES) {
        SYNode *node = OSAtomicDequeue(&symbolList, offsetof(SYNode, next)); 
        //取空则停止循环 
        if(node == NULL){ 
            break; 
        } 
        Dl_info info; 
        dladdr(node->pc, &info); 
        NSLog(@"%s", info.dli_sname);
    }
}

原子队列保存符号步骤

  • 定义: 定义原子队列结构体,pc存储当前返回地址,next存储下一个节点地址
  • 收集:
    创建结构体,对pc赋值,next设置为NULL
    结构体入栈
    offsetof:宏,参数1传入类型,将下一个节点的地址返回给参数2
  • 生成order文件
    循环读取node,取空则停止循环
    将返回地址写入Dl_info结构体
    打印符号名称

运行工程,点击屏幕触发touchesBegan方法产生死循环

// 控制台打印
 -[ViewController touchesBegan:withEvent:]
 -[ViewController touchesBegan:withEvent:]
 -[ViewController touchesBegan:withEvent:]
 -[ViewController touchesBegan:withEvent:]
 -[ViewController touchesBegan:withEvent:]
......

解决循环引发的天坑

上面运行工程产生了死循环,下面进行调试

  • touchesBegan方法中设置断点,运行项目查看汇编代码,发现touchesBegan方法中插入了三次__sanitizer_cov_trace_pc_guard函数的调用
image.png

这就是循环引发的天坑,SanitizerCoverage不但拦截方法函数Block,还会对循环进行HOOK。
案例中while循环被HOOK,循环的执行会进入回调函数。回调函数中存入队列的还是touchesBegan的函数地址,这会导致队列中永远存在一个到两个touchesBegan,next永远获取不完。

解决办法:
Build Setting -> Other C Flags中,将配置修改为-fsanitize-coverage=func,trace-pc-guard对其增加func参数

image.png
  • 再次运行项目,点击屏幕,控制台打印如下
 -[ViewController touchesBegan:withEvent:]
 -[SceneDelegate sceneDidBecomeActive:]
 -[SceneDelegate sceneWillEnterForeground:]
 -[ViewController viewDidLoad]
 -[SceneDelegate window]
 -[SceneDelegate window]
 -[SceneDelegate window]
 -[SceneDelegate scene:willConnectToSession:options:]
 -[SceneDelegate window]
 -[SceneDelegate window]
 -[SceneDelegate setWindow:]
 -[SceneDelegate window]
 -[AppDelegate application:didFinishLaunchingWithOptions:]
 main
 +[ViewController load]

修改配置项仅拦截方法的调用,成功解决循环引发的天坑。

取反&去重

还有几个问题需要解决?

  • 过滤掉自身touchesBegan的函数名称
  • 不是OC的函数Block等符号,需要在符号名称之前增加_
  • 相同的函数符号,需要进行去重
  • 队列原则先进后出,所以我们需要的符号顺序需要反转

修改touchesBegan方法,解决上述问题

- (void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event {
    // 定义数组
    NSMutableArray<NSString *> *symbolNames = [NSMutableArray array]; 
    while (YES) { 
        SYNode *node = OSAtomicDequeue(&symbolList, offsetof(SYNode, next)); 
        if(node == NULL){
             break; 
        } 
        Dl_info info; 
        dladdr(node->pc, &info); 
        // 转字符串
        NSString *name = @(info.dli_sname); 
        // 不是OC函数名称添加_,获取符号名称,如果不是+[和-[开头,视为函数或Block,前面加_
        BOOL isObjc = [name hasPrefix:@"+["] || [name hasPrefix:@"-["];
        NSString * symbolName = isObjc ? name : [@"_" stringByAppendingString:name];
        [symbleNames addObject:symbolName];
    } 
    // 反向遍历数组
    symbolNames = (NSMutableArray<NSString *> *)[[symbolNames reverseObjectEnumerator] allObjects]; 
    NSLog(@"%@",symbleNames); 
}

// 运行工程,控制台打印
 TraceDemo[47155:640473] (
    "+[ViewController load]",
    "_main",
    "-[AppDelegate application:didFinishLaunchingWithOptions:]",
    "-[SceneDelegate window]",
    "-[SceneDelegate setWindow:]",
    "-[SceneDelegate window]",
    "-[SceneDelegate window]",
    "-[SceneDelegate scene:willConnectToSession:options:]",
    "-[SceneDelegate window]",
    "-[SceneDelegate window]",
    "-[SceneDelegate window]",
    "-[ViewController viewDidLoad]",
    "-[ViewController setAge:]",
    "-[SceneDelegate sceneWillEnterForeground:]",
    "-[SceneDelegate sceneDidBecomeActive:]",
    "-[ViewController touchesBegan:withEvent:]"
)

相同符号去重

- (void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event {
    // 定义数组
    NSMutableArray<NSString *> *symbolNames = [NSMutableArray array]; 
    while (YES) { 
        SYNode *node = OSAtomicDequeue(&symbolList, offsetof(SYNode, next)); 
        if(node == NULL){
             break; 
        } 
        Dl_info info; 
        dladdr(node->pc, &info); 
        // 转字符串
        NSString *name = @(info.dli_sname); 
        // 给OC函数名称添加_
        BOOL isObjc = [name hasPrefix:@"+["] || [name hasPrefix:@"-["];
        NSString * symbolName = isObjc ? name : [@"_" stringByAppendingString:name];
        [symbleNames addObject:symbolName];
    } 
    // 反向遍历数组
    NSEnumerator * em = [symbleNames reverseObjectEnumerator];
    NSMutableArray * funcs = [NSMutableArray arrayWithCapacity:symbleNames.count];
    NSString * name;
    while (name = [em nextObject]) {
        // 如果符号名称不在数组中,添加到数组
        if (![funcs containsObject:name]) {//去重:数组没有name
            [funcs addObject:name];
        }
    }
    //去掉当前函数名称touchesBegan
    [funcs removeObject:[NSString stringWithFormat:@"%s",__func__]];
    
    NSLog(@"%@",funcs);
}

// 运行工程,控制台打印
TraceDemo[47196:643780] (
    "+[ViewController load]",
    "_main",
    "-[AppDelegate application:didFinishLaunchingWithOptions:]",
    "-[SceneDelegate window]",
    "-[SceneDelegate setWindow:]",
    "-[SceneDelegate scene:willConnectToSession:options:]",
    "-[ViewController viewDidLoad]",
    "-[ViewController setAge:]",
    "-[SceneDelegate sceneWillEnterForeground:]",
    "-[SceneDelegate sceneDidBecomeActive:]"
)

生成order文件

  • 修改touchesBegan方法,将符号列表写入.order文件
// 添加load方法与block
+(void)load {
    block();
}

void(^block)(void) = ^(void){
    NSLog(@"block函数执行!");
};

- (void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event {
    // 定义数组
    NSMutableArray<NSString *> *symbolNames = [NSMutableArray array]; 
    while (YES) { 
        SYNode *node = OSAtomicDequeue(&symbolList, offsetof(SYNode, next)); 
        if(node == NULL){
             break; 
        } 
        Dl_info info; 
        dladdr(node->pc, &info); 
        // 转字符串
        NSString *name = @(info.dli_sname); 
        // 给OC函数名称添加_
        BOOL isObjc = [name hasPrefix:@"+["] || [name hasPrefix:@"-["];
        NSString * symbolName = isObjc ? name : [@"_" stringByAppendingString:name];
        [symbleNames addObject:symbolName];
    } 
    // 反向遍历数组
    NSEnumerator * em = [symbleNames reverseObjectEnumerator];
    NSMutableArray * funcs = [NSMutableArray arrayWithCapacity:symbleNames.count];
    NSString * name;
    while (name = [em nextObject]) {
        // 如果符号名称不在数组中,添加到数组
        if (![funcs containsObject:name]) {//去重:数组没有name
            [funcs addObject:name];
        }
    }
    //去掉当前函数名称touchesBegan
    [funcs removeObject:[NSString stringWithFormat:@"%s",__func__]];
    
    //写入文件
    //1.编程字符串
    NSString * funcStr = [funcs componentsJoinedByString:@"\n"];
    NSString * filePath = [NSTemporaryDirectory() stringByAppendingPathComponent:@"hank.order"];
    NSData * file = [funcStr dataUsingEncoding:NSUTF8StringEncoding];
    [[NSFileManager defaultManager] createFileAtPath:filePath contents:file attributes:nil];
    
    NSLog(@"%@",funcStr);
}

// 运行工程,控制台打印
+[ViewController load]
_block_block_invoke
_main
-[AppDelegate application:didFinishLaunchingWithOptions:]
-[SceneDelegate window]
-[SceneDelegate setWindow:]
-[SceneDelegate scene:willConnectToSession:options:]
-[ViewController viewDidLoad]
-[ViewController setAge:]
-[SceneDelegate sceneWillEnterForeground:]
-[SceneDelegate sceneDidBecomeActive:]
  • 拿到.order文件选择Add Additional Simulators...
image.png
  • 选中案例App点击Downlad Container...,如下图
image.png
  • 选择存放路径下载.xcappdata文件,右键显示包内容,在AppData/tmp目录下找到.order文件
  • .order文件拷贝到工程根目录,在Build Setting -> Order File进行配置
image.png
  • Build Settings -> Write Link Map File设置为YES
image.png
  • 编译项目打开LinkMap文件查看,发现配置生效二进制重排成功
image.png

Swift符号覆盖

  • 创建SwiftTest.swift文件代码如下
import UIKit

class SwiftTest: NSObject {
    @objc class public func swiftTest(){
        print("Swift Test ...")
    }
}
  • ViewControllerload方法中分别调用BlockswiftTest方法
+(void)load
{
    [SwiftTest swiftTest];
    block();
}

void(^block)(void) = ^(void){
    NSLog(@"block函数执行!");
};
  • Other C Flags中的配置仅对Clang编译器生效。而Swift使用swiftc编译器,要想获得swift函数符号,需要对Other Swift Flags添加-sanitize-coverage=func-sanitize=undefined两项
image.png
  • 运行项目,点击屏幕,查看控制台输出内容
+[ViewController load]
_$s9TraceDemo9SwiftTestC05swiftD0yyFZTo
_$s9TraceDemo9SwiftTestC05swiftD0yyFZ
_$ss5print_9separator10terminatoryypd_S2StFfA0_
_$ss5print_9separator10terminatoryypd_S2StFfA1_
_block_block_invoke
_main
-[AppDelegate application:didFinishLaunchingWithOptions:]
-[SceneDelegate window]
-[SceneDelegate setWindow:]
-[SceneDelegate scene:willConnectToSession:options:]
-[ViewController viewDidLoad]
-[ViewController setAge:]
-[SceneDelegate sceneWillEnterForeground:]
-[SceneDelegate sceneDidBecomeActive:]

OC和Swift的混编工程中,成功得到Swift函数符号

相关文章

网友评论

    本文标题:Clang插桩

    本文链接:https://www.haomeiwen.com/subject/iitzoltx.html