美文网首页
dyld与objc的关联分析

dyld与objc的关联分析

作者: Y丶舜禹 | 来源:发表于2020-10-15 21:58 被阅读0次

    前言

    在之前的文章dyld加载流程,我们已经探究了dyld的加载流程,那么接下来我们就对dyld又是如何与objc关联起来进行探究。

    objc_init分析

    首先我们对objc_init的源码进行分析

    void _objc_init(void)
    {
        static bool initialized = false;
        if (initialized) return;
        initialized = true;
        
        // fixme defer initialization until an objc-using image is found?
        //读取影响运行时的环境变量,如果需要,还可以打开环境变量帮助 export OBJC_HRLP = 1
        environ_init();
        //关于线程key的绑定,例如线程数据的析构函数
        tls_init();
        //运行C++静态构造函数,在dyld调用我们的静态析构函数之前,libc会调用_objc_init(),因此我们必须自己做
        static_init();
        //runtime运行时环境初始化,里面主要是unattachedCategories、allocatedClasses -- 分类初始化
        runtime_init();
        //初始化libobjc的异常处理系统
        exception_init();
        //缓存条件初始化
        cache_init();
        //启动回调机制,通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载trampolines dylib
        _imp_implementationWithBlock_init();
    
        /*
         _dyld_objc_notify_register -- dyld 注册的地方
         - 仅供objc运行时使用
         - 注册处理程序,以便在映射、取消映射 和初始化objc镜像文件时使用,dyld将使用包含objc_image_info的镜像文件数组,回调 mapped 函数
         
         map_images:dyld将image镜像文件加载进内存时,会触发该函数
         load_images:dyld初始化image会触发该函数
         unmap_image:dyld将image移除时会触发该函数
         */
        _dyld_objc_notify_register(&map_images, load_images, unmap_image);
    
    #if __OBJC2__
        didCallDyldNotifyRegister = true;
    #endif
    }
    

    总结下来objc_init一共做了以下几件事 :

    • environ_init:初始化一系列环境变量,并读取影响运行时的环境变量
    • tls_init:关于线程key的绑定
    • static_init:运行C++静态构造函数(只会运行系统级别的构造函数),在dyld调用静态析构函数之前,libc会调用_objc_init
      *runtime_initruntime运行时环境初始化,里面操作是unattachedCategories、allocatedClasses(表的初始化)
    • exception_init:初始化libObjc的异常处理系统
    • cache_initcache缓存初始化
    • _imp_implementationWithBlock_init :启动回调机制,通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载trampolines dylib
    • _dyld_objc_notify_registerdyld的注册

    下面我们逐个分析

    1. environ_init

    点进去,发现代码很多,我们忽略其他的代码,只看其中的关键代码

    void environ_init(void) 
    {
     .....省略一些代码
    if (PrintHelp  ||  PrintOptions) {
             .....省略一些代码
            for (size_t i = 0; i < sizeof(Settings)/sizeof(Settings[0]); i++) {
                const option_t *opt = &Settings[i];            
                if (PrintHelp) _objc_inform("%s: %s", opt->env, opt->help);
                if (PrintOptions && *opt->var) _objc_inform("%s is set", opt->env);
            }
        }
    }
    

    为了看环境变量的输出,我们直接将控制条件干掉

    for (size_t i = 0; i < sizeof(Settings)/sizeof(Settings[0]); i++) {
            const option_t *opt = &Settings[I];
            _objc_inform("%s: %s", opt->env, opt->help);
            _objc_inform("%s is set", opt->env);
     }
    

    运行,打印...

    控制台输出如下:

    objc[75885]: OBJC_PRINT_IMAGES: log image and library names as they are loaded
    objc[75885]: OBJC_PRINT_IMAGES is set
    objc[75885]: OBJC_PRINT_IMAGE_TIMES: measure duration of image loading steps
    objc[75885]: OBJC_PRINT_IMAGE_TIMES is set
    objc[75885]: OBJC_PRINT_LOAD_METHODS: log calls to class and category +load methods
    objc[75885]: OBJC_PRINT_LOAD_METHODS is set
    objc[75885]: OBJC_PRINT_INITIALIZE_METHODS: log calls to class +initialize methods
    objc[75885]: OBJC_PRINT_INITIALIZE_METHODS is set
    objc[75885]: OBJC_PRINT_RESOLVED_METHODS: log methods created by +resolveClassMethod: and +resolveInstanceMethod:
    objc[75885]: OBJC_PRINT_RESOLVED_METHODS is set
    objc[75885]: OBJC_PRINT_CLASS_SETUP: log progress of class and category setup
    objc[75885]: OBJC_PRINT_CLASS_SETUP is set
    objc[75885]: OBJC_PRINT_PROTOCOL_SETUP: log progress of protocol setup
    objc[75885]: OBJC_PRINT_PROTOCOL_SETUP is set
    objc[75885]: OBJC_PRINT_IVAR_SETUP: log processing of non-fragile ivars
    .....
    

    这里另外提一下你还可以通过终端指令export OBJC_help = 1输出环境变量,进行装13...

    这些环境变量,均可以通过target -- Edit Scheme -- Run --Arguments -- Environment Variables配置,其中常用的环境变量主要有以下几个:

    • DYLD_PRINT_STATISTICS:设置 DYLD_PRINT_STATISTICS为YES,控制台就会打印 App 的加载时长,包括整体加载时长和动态库加载时长,即main函数之前的启动时间(查看pre-main耗时),可以通过设置了解其耗时部分,并对其进行启动优化
    • OBJC_DISABLE_NONPOINTER_ISA:杜绝生成相应的nonpointer isanonpointer isa指针地址 末尾为1 ),生成的都是普通的isa
    • OBJC_PRINT_LOAD_METHODS:打印ClassCategory+load方法的调用信息
    • NSDoubleLocalizedStrings:项目做国际化本地化(Localized)的时候是一个挺耗时的工作,想要检测国际化翻译好的语言文字UI会变成什么样子,可以指定这个启动项。可以设置 NSDoubleLocalizedStringsYES
    • NSShowNonLocalizedStrings:在完成国际化的时候,偶尔会有一些字符串没有做本地化,这时就可以设置NSShowNonLocalizedStringsYES,所有没有被本地化的字符串全都会变成大写

    接下来我们以OBJC_DISABLE_NONPOINTER_ISA为例,展示一下环境变量的作用

    在不设置环境变量OBJC_DISABLE_NONPOINTER_ISA 的时候,打印 personisa信息

    LLDB展示如下

    KCObjc was compiled with optimization - stepping may behave oddly; variables may not be available.
    (lldb) x/4gx person
    0x101006210: 0x001d800100002265 0x0000000000000000
    0x101006220: 0x0000000000000000 0x0000000000000000
    (lldb) p/t 0x001d800100002265  //注:p/t 二进制打印地址信息
    (long) $1 = 0b0000000000011101100000000000000100000000000000000010001001100101
    

    设置环境变量 OBJC_DISABLE_NONPOINTER_ISAYES,之后再次打印personisa 信息

    设置环境变量
    LLDB展示如下
    KCObjc was compiled with optimization - stepping may behave oddly; variables may not be available.
    (lldb) x/4gx person
    0x10100a9b0: 0x0000000100002260 0x0000000000000000
    0x10100a9c0: 0x0000000000000000 0x0000000000000000
    (lldb) p/t 0x0000000100002260
    (long) $1 = 0b0000000000000000000000000000000100000000000000000010001001100000
    
    

    这里我们可以看到最后一位的变换:由 1 变为 0,在之前的文章isa结构分析中我们介绍过,最后一位就是 nonpointer 位,表示是否对 isa 指针开启指针优化。 0:纯 isa 指针;1:不止是类对象地址。isa 中包含了类信息、对象的引用计数等。

    通过设置OBJC_DISABLE_NONPOINTER_ISA可以控制isa优化开关,从而优化整个内存结构

    接下来我们再试试设置环境 OBJC_PRINT_LOAD_METHODS = YES,打印出项目中所有的load方法,控制台日志如下:

    ···省略一些打印
    objc[76428]: LOAD: class 'NSApplication' scheduled for +load
    objc[76428]: LOAD: class 'NSBinder' scheduled for +load
    objc[76428]: LOAD: class 'NSColorSpaceColor' scheduled for +load
    objc[76428]: LOAD: class 'NSNextStepFrame' scheduled for +load
    objc[76428]: LOAD: category 'NSColor(NSUIKitSupport)' scheduled for +load
    objc[76428]: LOAD: +[NSApplication load]
    
    objc[76428]: LOAD: +[NSBinder load]
    
    objc[76428]: LOAD: +[NSColorSpaceColor load]
    
    objc[76428]: LOAD: +[NSNextStepFrame load]
    
    objc[76428]: LOAD: +[NSColor(NSUIKitSupport) load]
    ···省略一些打印
    

    2. tls_init:线程key的绑定

    主要是本地线程池的初始化以及析构,源码如下

    void tls_init(void)
    {
    #if SUPPORT_DIRECT_THREAD_KEYS//本地线程池,用来进行处理
        pthread_key_init_np(TLS_DIRECT_KEY, &_objc_pthread_destroyspecific);//初始init
    #else
        _objc_pthread_key = tls_create(&_objc_pthread_destroyspecific);//析构
    #endif
    }
    

    3. static_init

    主要是运行系统级别的C++静态构造函数,在dyld调用我们的静态构造函数之前,libc调用_objc_init方法,即系统级别的C++构造函数 先于 自定义的C++构造函数 运行

    static void static_init()
    {
        size_t count;
        auto inits = getLibobjcInitializers(&_mh_dylib_header, &count);
        for (size_t i = 0; i < count; i++) {
            inits[i]();
        }
    }
    

    4. runtime_init

    主要是运行时的初始化,主要分为两部分:分类初始化、的表初始化

    void runtime_init(void)
    {
        objc::unattachedCategories.init(32);  // 分类的初始化
        objc::allocatedClasses.init(); // 储存加载完毕的类的方法
    }
    

    5. exception_init

    主要是初始化libobjc的异常处理系统,注册异常处理回调,从而监控异常的处理,我们可以通过设置回调函数来拦截异常信息

    void exception_init(void)
    {
        old_terminate = std::set_terminate(&_objc_terminate);
    }
    

    6. cache_init
    主要是缓存初始化,源码如下

    void cache_init()
    {
    #if HAVE_TASK_RESTARTABLE_RANGES
        mach_msg_type_number_t count = 0;
        kern_return_t kr;
    
        while (objc_restartableRanges[count].location) {
            count++;
        }
        //为当前任务注册一组可重新启动的缓存
        kr = task_restartable_ranges_register(mach_task_self(),
                                              objc_restartableRanges, count);
        if (kr == KERN_SUCCESS) return;
        _objc_fatal("task_restartable_ranges_register failed (result 0x%x: %s)",
                    kr, mach_error_string(kr));
    #endif // HAVE_TASK_RESTARTABLE_RANGES
    }
    

    7. _imp_implementationWithBlock_init

    该方法主要是启动回调机制,通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载libobjc-trampolines.dylib,其源码如下

    void
    _imp_implementationWithBlock_init(void)
    {
    #if TARGET_OS_OSX
        // Eagerly load libobjc-trampolines.dylib in certain processes. Some
        // programs (most notably QtWebEngineProcess used by older versions of
        // embedded Chromium) enable a highly restrictive sandbox profile which
        // blocks access to that dylib. If anything calls
        // imp_implementationWithBlock (as AppKit has started doing) then we'll
        // crash trying to load it. Loading it here sets it up before the sandbox
        // profile is enabled and blocks it.
    
        // 在某些进程中渴望加载libobjc-trampolines.dylib。一些程序(最著名的是嵌入式Chromium的较早版本使用的QtWebEngineProcess)启用了严格限制的沙箱配置文件,从而阻止了对该dylib的访问。如果有任何调用imp_implementationWithBlock的操作(如AppKit开始执行的操作),那么我们将在尝试加载它时崩溃。将其加载到此处可在启用沙箱配置文件之前对其进行设置并阻止它。
        // This fixes EA Origin (rdar://problem/50813789)
        // and Steam (rdar://problem/55286131)
        if (__progname &&
            (strcmp(__progname, "QtWebEngineProcess") == 0 ||
             strcmp(__progname, "Steam Helper") == 0)) {
            Trampolines.Initialize();
        }
    #endif
    }
    

    8. _dyld_objc_notify_register

    _dyld_objc_notify_register这个方法是跨库执行的,我们在dyld加载流程已经有详细说明,源码如下

    //
    // Note: only for use by objc runtime
    // Register handlers to be called when objc images are mapped, unmapped, and initialized.
    // Dyld will call back the "mapped" function with an array of images that contain an objc-image-info section.
    // Those images that are dylibs will have the ref-counts automatically bumped, so objc will no longer need to
    // call dlopen() on them to keep them from being unloaded.  During the call to _dyld_objc_notify_register(),
    // dyld will call the "mapped" function with already loaded objc images.  During any later dlopen() call,
    // dyld will also call the "mapped" function.  Dyld will call the "init" function when dyld would be called
    // initializers in that image.  This is when objc calls any +load methods in that image.
    //
    void registerObjCNotifiers(_dyld_objc_notify_mapped mapped, _dyld_objc_notify_init init, _dyld_objc_notify_unmapped unmapped)
    {
        // record functions to call
        sNotifyObjCMapped   = mapped;
        sNotifyObjCInit     = init;
        sNotifyObjCUnmapped = unmapped;
    
        // call 'mapped' function with all images mapped so far
        try {
            notifyBatchPartial(dyld_image_state_bound, true, NULL, false, true);
        }
        catch (const char* msg) {
            // ignore request to abort during registration
        }
    
        // <rdar://problem/32209809> call 'init' function on all images already init'ed (below libSystem)
        for (std::vector<ImageLoader*>::iterator it=sAllImages.begin(); it != sAllImages.end(); it++) {
            ImageLoader* image = *it;
            if ( (image->getState() == dyld_image_state_initialized) && image->notifyObjC() ) {
                dyld3::ScopedTimer timer(DBG_DYLD_TIMING_OBJC_INIT, (uint64_t)image->machHeader(), 0, 0);
                (*sNotifyObjCInit)(image->getRealPath(), image->machHeader());
            }
        }
    }
    

    我们通过上面的注释得出

    • 仅供objc运行时使用
    • 注册处理程序,以便在映射、取消映射初始化objc图像时调用
    • dyld将会通过一个包含objc-image-info的镜像文件的数组回调mapped函数

    方法中的三个参数分别表示的含义如下:

    map_images:dyld将image(镜像文件)加载进内存时,会触发该函数
    load_image:dyld初始化image会触发该函数
    unmap_image:dyld将image移除时,会触发该函数

    dyld与Objc的关联

    我们通过源码来体现它们之间的关联关系

    首先是dyld源码实现

    void _dyld_objc_notify_register(_dyld_objc_notify_mapped    mapped,
                                    _dyld_objc_notify_init      init,
                                    _dyld_objc_notify_unmapped  unmapped)
    {
      dyld::registerObjCNotifiers(mapped, init, unmapped);
    }
    

    然后是libobjc源码的调用

    _dyld_objc_notify_register(&map_images, load_images, unmap_image);
    

    我们得出结论

    mapped 等价于 map_images
    init 等价于load_images
    unmapped 等价于 unmap_image

    在上篇dyld加载流程中,我们知道了load_images是在notifySingle方法中,通过sNotifyObjCInit调用的,如下所示

    notifySingle

    然后我们在dyld源码中查找赋值 sNotifyObjCInit 的地方,可以找到是在 registerObjCNotifiers 函数中

    void registerObjCNotifiers(_dyld_objc_notify_mapped mapped, _dyld_objc_notify_init init, _dyld_objc_notify_unmapped unmapped)
    {
        // record functions to call
        sNotifyObjCMapped   = mapped;
        sNotifyObjCInit     = init;
        sNotifyObjCUnmapped = unmapped;
        
        // 省略代码......
    }
    

    继续查找 registerObjCNotifiers调用的地方,最终找到了

    _dyld_objc_notify_register
    void _dyld_objc_notify_register(_dyld_objc_notify_mapped    mapped,
                                    _dyld_objc_notify_init      init,
                                    _dyld_objc_notify_unmapped  unmapped)
    {
        dyld::registerObjCNotifiers(mapped, init, unmapped);
    }
    

    所以这里就可以得出 dyld与 objc 直接的关联关系了,也就是

    • sNotifyObjCMapped == mapped == map_images;
    • sNotifyObjCInit == init == load_images;
    • sNotifyObjCUnmapped == unmapped == unmap_image;

    至此,我们终于理清了它们真正的关联关系了。

    map_images 的调用时机

    接下来我们看看 map_images 的调用时机,也是一样的套路,我们搜索 sNotifyObjCMapped 函数指针是在哪里进行调用的

    sNotifyObjCMapped调用

    然后我们继续搜索 notifyBatchPartial 调用的地方,看到是在 registerObjCNotifiers 中进行调用的。

    notifyBatchPartial调用

    所以我们在这里可以得出

    • map_images 是在 registerObjCNotifiers 中进行调用
    • map_imagesload_images 先前调用。

    相关文章

      网友评论

          本文标题:dyld与objc的关联分析

          本文链接:https://www.haomeiwen.com/subject/tvkwpktx.html