美文网首页消零派086号
iOS底层原理--002:instanceSize & mall

iOS底层原理--002:instanceSize & mall

作者: 帅驼驼 | 来源:发表于2021-06-11 08:14 被阅读0次
    instanceSize分析

    instanceSize函数是alloc的核心方法之一,负责计算内存大小

    打开objc4-818.2源码

    进入instanceSize函数

    inline size_t instanceSize(size_t extraBytes) const {
       if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
           return cache.fastInstanceSize(extraBytes);
       }
       
       size_t size = alignedInstanceSize() + extraBytes;
       if (size < 16) size = 16;
       return size;
    }
    
    • fastInstanceSize:编译器快速计算内存大小
    • alignedInstanceSize:得到对齐后的实例对象大小
    • extraBytes:额外字节数,传入的值为0
    • size:不能小于16字节

    进入fastInstanceSize函数

    size_t fastInstanceSize(size_t extra) const {
       ASSERT(hasFastInstanceSize(extra));
    
       if (__builtin_constant_p(extra) && extra == 0) {
           return _flags & FAST_CACHE_ALLOC_MASK16;
       } else {
           size_t size = _flags & FAST_CACHE_ALLOC_MASK;
           return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
       }
    }
    
    • __builtin_constant_pGCC的内建函数。用于判断一个值是否为编译时常数,如果参数EXP的值是常数,函数返回1,否则返回0
    • extra:额外字节数,传入的值为0
    • FAST_CACHE_ALLOC_DELTA16:来自setFastInstanceSize方法的8字节
    • align1616字节对齐

    FAST_CACHE_ALLOC_DELTA16定义:

    #define FAST_CACHE_ALLOC_DELTA16      0x0008
    

    进入align16函数,16字节对齐算法

    static inline size_t align16(size_t x) {
       return (x + size_t(15)) & ~size_t(15);
    }
    

    进入alignedInstanceSize函数

    uint32_t alignedInstanceSize() const {
       return word_align(unalignedInstanceSize());
    }
    
    • unalignedInstanceSize:得到未对齐的实例对象大小
    • word_align8字节对齐

    进入unalignedInstanceSize函数

    uint32_t unalignedInstanceSize() const {
       ASSERT(isRealized());
       return data()->ro()->instanceSize;
    }
    

    进入word_align函数,8字节对齐算法

    static inline uint32_t word_align(uint32_t x) {
       return (x + WORD_MASK) & ~WORD_MASK;
    }
    

    WORD_MASK定义:

    #   define WORD_MASK 7UL
    

    instanceSize流程图

    字节对齐

    word_align方法中,字节对齐算法为:

    (x + N) & ~N
    
    • &:与运算,都是1结果为1,反之为0
    • ~:取反,1变为00变为1

    例如:8字节对齐,N必须为7

    假设:传入的x10

    x + N = 170001 0111

    ~N7取反,1111 1000

    0001 0111 & 1111 1000 = 0001 0000

    转换10进制16

    为什么需要字节对齐?

    内存以字节为基本单位,当CPU存取数据时,以块为单位

    读取未对齐数据,需要多次访问内存,极大降低CPU的性能

    如果数据存储在自然对齐的位置上,可以降低CPU的存取次数。以空间换取时间,提升CPU的访问速率


    为什么是8字节对齐?

    arm64中,成员变量的数据类型最大占8字节

    如果对齐规则大于8字节,会造成内存空间的浪费。如果小于8字节,读取占8字节的数据类型,需要多次访问内存

    故此,对齐规则为8字节是最好的选择

    对象内存的影响因素

    对象的成员变量会影响其内存大小,实例方法和类方法,不会对其产生影响。而属性的本质是get/set方法,所以也不会影响

    在堆区分配的内存空间,首先存储对象isa,下面依次排列对象的成员变量

    案例:

    打开LGPerson.h文件,写入以下代码:

    @interface LGPerson : NSObject
    
    @property (strong,nonatomic) NSString *name;
    @property (strong,nonatomic) NSString *nick;
    @property (assign,nonatomic) int age;
    @property (assign,nonatomic) bool age1;
    @property (assign,nonatomic) double height;
    
    @end
    

    打开main.m文件,写入以下代码:

    int main(int argc, const char * argv[]) {
       @autoreleasepool {
           LGPerson *per= [LGPerson alloc];
           per.name = @"Zang";
           per.nick = @"Z";
           per.age = 18;
           per.age1 = 1;
           per.height = 180.0;
           
           NSLog(@"%@",per);
       }
       return 0;
    }
    

    lldb中,打印对象的内存数据

    【方式一】使用x指令

    x per
    -------------------------
    0x10072d690: 4d 83 00 00 01 80 1d 01 01 00 00 00 12 00 00 00  M...............
    0x10072d6a0: 30 40 00 00 01 00 00 00 50 40 00 00 01 00 00 00  0@......P@......
    
    • xmemory read指令的简写,作用是内存读取并打印
    • iOS为小端模式,内存的读取从右往左
    • 0x10072d690为对象的首地址

    【方式二】使用View Memory

    LGPerson对象的isa5个成员变量

    【方式三】使用x/nfu指令

    x/6g per
    -------------------------
    0x10072d690: 0x011d80010000834d 0x0000001200000001
    0x10072d6a0: 0x0000000100004030 0x0000000100004050
    0x10072d6b0: 0x4066800000000000 0x0000000000000000
    
    • x/nfu指令属于有规律打印,iOS为小端模式,所以打印结果与x per刚好相反
    • x:每一段以16进制打印
    • n:打印的内存单元个数
    • u:地址单元的长度
      g:八字节
      w:四字节
      h:双字节
      b:单字节
    • f:格式化打印方式
      x:十六进制
      d:十进制
      u:十进制,无符号整型
      o:八进制
      t:二进制
      a:十六进制 + 字符串
      i:指令格式
      c:字符格式
      f:浮点数格
    • 最前面0x10072d690为对象首地址,后面的0x011d80010000834d是成员变量的值,0x10072d690地址指向0x011d80010000834d的值

    标记1:存储对象isa,和ISA_MASK进行&运算,才能正常打印

    ISA_MASK定义:

    #   define ISA_MASK        0x00007ffffffffff8ULL
    

    打印isa

    po 0x011d80010000834d & 0x00007ffffffffff8
    -------------------------
    LGPerson
    

    标记28字节中存储了ageage1两个属性

    ageint类型,占4字节

    age1bool类型,占1字节

    两个属性的大小之和,未超过8字节。为了避免内存的浪费,系统做了内存对齐优化,将两个属性并存到一个8字节

    打印age

    po 0x00000012
    -------------------------
    18
    

    打印age1

    po 0x00000001
    -------------------------
    1
    

    标记3:存储name属性

    po 0x0000000100004030
    -------------------------
    Zang
    

    标记4:存储nick属性

    po 0x0000000100004050
    -------------------------
    Z
    

    标记5:存储height属性。heightdouble类型,需要进行格式化打印

    e -f f -- 0x4066800000000000
    -------------------------
    180
    

    或者

    p/f 0x4066800000000000
    -------------------------
    180
    
    结构体内存对齐

    内存对⻬的原则

    • 数据成员对⻬规则:结构(struct)或联合(union)的数据成员,第⼀个数据成员放在offset0的地⽅,以后每个数据成员存储的起始位置要从该成员⼤⼩或者成员的⼦成员⼤⼩(只要该成员有⼦成员,例如:数组、结构体等)的整数倍开始
      ◦ 例如:int4字节,则要从4的整数倍地址开始存储。如果当前开始存储的位置为9,需要空出91011,在12的位置才可存储
    • 结构体作为成员:如果⼀个结构⾥有某些结构体成员,则结构体成员要从其内部最⼤元素⼤⼩的整数倍地址开始存储
      ◦ 例如:struct a⾥存有struct bb⾥有charintdouble等元素,那b应该从8的整数倍开始存储
    • 收尾⼯作:结构体的总⼤⼩,也就是sizeof的结果,必须是其内部最⼤成员的整数倍,不⾜的要补⻬

    案例1:

    struct LGStruct1 {
       double a;
       char b;
       int c;
       short d;
    }struct1;
    
    • a8字节,存储在0~7位置
    • b1字节,存储在8位置。因为81的倍数,满足条件
    • c4字节9~11都不是4的倍数,无法存储,将其空出。所以c存储在12~15位置
    • d2字节,存储在16~17位置
    • 最后进行收尾⼯作,满足内部最⼤成员的整数倍,补⻬至24
    NSLog(@"struct1:%lu",sizeof(struct1));
    -------------------------
    struct1:24
    

    案例2:

    struct LGStruct2 {
       double a;
       int b;
       char c;
       short d;
    }struct2;
    
    • a8字节,存储在0~7位置
    • b4字节,存储在8~11位置
    • c1字节,存储在12位置
    • d2字节,13不是2的倍数,无法存储,将其空出。所以d存储在14~15位置
    • 最后进行收尾⼯作,满足内部最⼤成员的整数倍,补⻬至16
    NSLog(@"struct2:%lu",sizeof(struct2));
    -------------------------
    struct2:16
    

    案例3:

    struct LGStruct3 {
       double a;
       int b;
       char c;
       short d;
       int e;
       struct LGStruct1 str;
    }struct3;
    
    • a8字节,存储在0~7位置
    • b4字节,存储在8~11位置
    • c1字节,存储在12位置
    • d2字节,13不是2的倍数,无法存储,将其空出。所以d存储在14~15位置
    • e4字节,存储在16~19位置
    • str为结构体类型,最大成员占8字节。包含结构体成员,从其内部最⼤元素⼤⼩的整数倍地址开始存储。所以str的起始位置为24str结构体内存对齐后占24字节,所以LGStruct3的大小为24 + 24 = 48
    NSLog(@"struct3:%lu",sizeof(struct3));
    -------------------------
    struct3:48
    
    获取内存大小的三种方式

    【方式一】sizeof

    • sizeof不是函数,而是一个操作符
    • 一般会传入数据类型,编译器在编译时期即可确定大小
    • sizeof得到的大小,即是该类型占用的空间大小

    【方式二】class_getInstanceSize

    • class_getInstanceSizeruntime提供的api
    • 作用:获取类的实例对象所占用的内存大小
    • 本质:获取实例对象中成员变量的内存大小
    • 采用8字节对齐,参照对象的属性大小

    【方式三】malloc_size

    • 作用:获取系统实际分配的内存大小
    • 采用16字节对齐,参照整个对象的大小
    • 实际分配的内存大小,必须是16的整数倍

    案例

    打开LGPerson.h文件,写入以下代码:

    @interface LGPerson : NSObject
    
    @property (nonatomic, copy) NSString *name;
    @property (nonatomic, copy) NSString *nickName;
    @property (nonatomic, assign) int age;
    @property (nonatomic, assign) long height;
    
    @end
    

    打开main.m文件,写入以下代码:

    #import <Foundation/Foundation.h>
    #import "LGPerson.h"
    #import <objc/runtime.h>
    #import <malloc/malloc.h>
    
    int main(int argc, const char * argv[]) {
       @autoreleasepool {
           LGPerson *person = [LGPerson alloc];
           NSLog(@"sizeof:%lu",sizeof(person));
           NSLog(@"class_getInstanceSize:%lu",class_getInstanceSize([LGPerson class]));
           NSLog(@"malloc_size:%lu",malloc_size((__bridge const void *)(person)));
       }
       return 0;
    }
    

    打印结果:

    sizeof:8
    class_getInstanceSize:40
    malloc_size:48
    
    • sizeof8,因为person对象,本质是指针地址,占8字节
    • class_getInstanceSize40LGPerson的成员变量大小为36字节8字节对齐后,占40字节
    • malloc_size48,系统分配的内存大小,经过16字节对齐后,占48字节

    LGPerson中,即使没有任何成员变量,class_getInstanceSize依然会占8字节

    因为LGPerson继承自NSObject,默认存在isa成员变量

    @interface NSObject <NSObject> {
    #pragma clang diagnostic push
    #pragma clang diagnostic ignored "-Wobjc-interface-ivars"
       Class isa  OBJC_ISA_AVAILABILITY;
    #pragma clang diagnostic pop
    }
    

    isaClass类型,本质是结构体指针,所以占8字节

    typedef struct objc_class *Class;
    

    objc_class继承自最原始的objc_object结构体

    struct objc_object {
       Class _Nonnull isa  OBJC_ISA_AVAILABILITY;
    };
    

    所以,万物皆对象,类也是一个对象

    malloc分析

    malloc函数是alloc的核心方法之一,负责开辟内存空间

    项目中,只能找到malloc_size的方法定义,它的代码实现在libmalloc源码中

    打开libmalloc-317.40.8源码

    进入calloc函数

    void *
    calloc(size_t num_items, size_t size) {
      return _malloc_zone_calloc(default_zone, num_items, size, MZ_POSIX);
    }
    

    进入_malloc_zone_calloc函数

    源码中只能找到calloc的函数声明,但是无法进入

    void   *(* MALLOC_ZONE_FN_PTR(calloc))(struct _malloc_zone_t *zone, size_t num_items, size_t size); /* same as malloc, but block returned is set to zero */
    

    在项目中,搜索calloc关键字,没有找到任何线索

    这种情况,可以尝试打印zone->calloc

    • 找到函数的真身:default_zone_calloc

    在全局搜索calloc时,虽然找不到函数实现,但是找到了calloc赋值代码。有赋值必然会存储值,通过打印也许可以得到线索


    或者,尝试Always Show Disassembly查看汇编代码

    • 也可得到相同线索:default_zone_calloc

    来到default_zone_calloc函数

    static void *
    default_zone_calloc(malloc_zone_t *zone, size_t num_items, size_t size) {
      zone = runtime_default_zone();
      return zone->calloc(zone, num_items, size);
    }
    

    又遇到了zone->calloc函数,继续使用lldb打印

    来到nano_malloc函数

    进入_nano_malloc_check_clear函数

    • segregated_size_to_fit:计算内存大小
    • segregated_next_block:开辟内存空间

    进入segregated_size_to_fit函数,计算内存大小

    static MALLOC_INLINE size_t
    segregated_size_to_fit(nanozone_t *nanozone, size_t size, size_t *pKey) {
      size_t k, slot_bytes;
    
      if (0 == size) {
          size = NANO_REGIME_QUANTA_SIZE; // Historical behavior
      }
      k = (size + NANO_REGIME_QUANTA_SIZE - 1) >> SHIFT_NANO_QUANTUM; // round up and shift for number of quanta
      slot_bytes = k << SHIFT_NANO_QUANTUM;                           // multiply by power of two quanta size
      *pKey = k - 1;                                                  // Zero-based!
    
      return slot_bytes;
    }
    

    NANO_REGIME_QUANTA_SIZESHIFT_NANO_QUANTUM定义:

    #define SHIFT_NANO_QUANTUM     4
    #define NANO_REGIME_QUANTA_SIZE    (1 << SHIFT_NANO_QUANTUM)   // 16
    
    • 1左移4位,即:16

    内存对齐的算法:

    (size + 15) >> 4 << 4
    

    算法作用为16字节对齐,保证分配的内存大小,必须是16的整数倍,与(x + N) & ~N算法有异曲同工之妙

    假设:传入的size40

    size + 15 = 550011 0111

    右移4位0000 0110

    左移4位0011 0000

    转换10进制为48

    进入segregated_next_block函数,开辟内存空间

    • 堆区开辟的空间是不连续的,期间可能因多线程、小于最大限制地址等原因,需要重新尝试while。当开辟空间成功,返回指针地址

    结构体内部,成员变量以8字节对齐。但是在堆区分配对象的内存大小,以16字节对齐

    系统为什么要这样设计?

    假设,堆区分配对象的内存大小,也按照8字节对齐。读取时,遇到多个连续存储的8字节对象,容易出现野指针或内存越界访问

    再有,NSObject自身占8字节,自定义对象一般来说也会有自定义的成员变量,所以自定义对象的大小,在大部分情况下,不会小于16字节

    所以,在堆区分配对象的内存大小,16字节对齐为最好的选择

    malloc流程图

    总结

    instanceSize分析

    • 命中缓存,执行fastInstanceSize函数。编译器快速计算内存大小,进行16字节对齐
    • 否则,执行alignedInstanceSize函数,进行8字节对齐
    • 返回size,不能小于16字节

    字节对齐

    • 算法:(x + N) & ~N
    • 目的是以空间换取时间,提升CPU的访问速率
    • 选择8字节对齐,因为arm64中,成员变量的数据类型最大占8字节

    对象内存的影响因素

    • 对象的成员变量,影响其内存大小
    • 打印对象的内存数据
      x指令
      View Memory
      x/nfu指令
    • iOS为小端模式,内存的读取从右往左
    • 对象isa,和ISA_MASK进行&运算,才能正常打印
    • 浮点类型,需要进行格式化,才能正常打印
      e -f f -- xxx
      p/f xxx

    结构体内存对齐

    • 存储的起始位置要从该成员⼤⼩或者成员的⼦成员⼤⼩的整数倍开始
    • 如果包含结构体成员,则结构体成员要从其内部最⼤元素⼤⼩的整数倍地址开始存储
    • 收尾⼯作,必须是其内部最⼤成员的整数倍,不⾜的要补⻬

    获取内存大小的三种方式

    • sizeof:得到的大小,即是该类型占用的空间大小
    • class_getInstanceSize:获取类的实例对象所占用的内存大小,采用8字节对齐,参照对象的属性大小
    • malloc_size:获取系统实际分配的内存大小,采用16字节对齐,参照整个对象的大小

    malloc分析

    • segregated_size_to_fit:计算内存大小
    • segregated_next_block:开辟内存空间
    • 内存对齐的算法:(size + 15) >> 4 << 4
    • 对象的内存大小以16字节对齐,有效减少野指针和内存越界访问的情况。自定义对象的大小,在大部分情况下,不会小于16字节

    相关文章

      网友评论

        本文标题:iOS底层原理--002:instanceSize & mall

        本文链接:https://www.haomeiwen.com/subject/kaejeltx.html