美文网首页
iOS:Tagged Pointer

iOS:Tagged Pointer

作者: 康小曹 | 来源:发表于2021-02-25 11:49 被阅读0次

    提示

    文中观点暂时只在 iOS 模拟器上针对 3 中情况进行测试,稳中观点在后期可能不断更新。因此,文中观点可能不够完整甚至是不正确,请自行验证,辩证看待。如有错误,烦请指正哦~~~

    一、常量区

    iOS 中,使用 @"" 生成的字符串都以常量的形式存储在常量区;

    NSString *string = @"caoxk---123456789010101010101001hgsuwwehscas";
    NSString *string2 = @"caoxk---123456789010101010101001hgsuwwehscas";
    

    转换成 C/C++之后的代码:

    // 直接取常量的内存地址
    NSString *string = (NSString *)&__NSConstantStringImpl__var_folders_yx_cblctywx29jd6fz28m0w4kyc0000gn_T_main_3b8aa9_mi_0;
    NSString *string2 = (NSString *)&__NSConstantStringImpl__var_folders_yx_cblctywx29jd6fz28m0w4kyc0000gn_T_main_3b8aa9_mi_1;
    

    如上,直接将常量的内存地址赋值给了局部变量,打印内存也可以验证:

    NSLog(@"局部变量内存地址:%p",&string);
    NSLog(@"字符串常量在常量区的内存地址:%p",string);
    NSLog(@"字符串常量在常量区的内存地址:%p",string2);
    

    输出结果:

    局部变量内存地址:0x7ffee495d358
    字符串常量在常量区的内存地址:0x10b2a4030
    字符串常量在常量区的内存地址:0x10b2a4030
    

    另外,在 Mach-O 文件的 CFString 字段中,可以查看字符串常量:

    Mach-O中的CFString

    另外,提一嘴全局区的细化:

    全局区如果划分的很细的话,可以分为全局已初始化区域、全局未初始化区域。其中全局已初始化区域又可以分为全局变量区、静态常量区。

    即:

    划分
    int a = 10;
    int b;
    int c;
    int d = 20;
    
    int main(int argc, char * argv[]) {
    
        NSLog(@"%p",&a);
        NSLog(@"%p",&b);
        NSLog(@"%p",&c);
        NSLog(@"%p",&d);
    }
    

    结果:

    2021-02-25 10:47:36.374 XKStringTest[58776:15939603] 0x100938e40
    2021-02-25 10:47:36.374 XKStringTest[58776:15939603] 0x100938e48
    2021-02-25 10:47:36.374 XKStringTest[58776:15939603] 0x100938e4c
    2021-02-25 10:47:36.375 XKStringTest[58776:15939603] 0x100938e44
    

    内存表现:

    ViewMemory

    结论:

    1. 内存中的常量区分为已初始化常量区和未初始化常量区;
    2. 已初始化常量区在内存段前面,未初始化的在内存段后面;
    3. 全局区三大区域内存地址顺序不变,声明顺序只影响变量所在区域的先后顺序;

    二、Tagged Pointer

    Tagged Pointer 使用 20 位的“类”内存地址来表示字符串:

    Tagged Pointer

    解释:

    1. 之所以说成 “类” 内存地址,是因为严格意义上而言,不存在这个内存地址。使用内存起始地址 a 来标志这不是一个真实的内存地址,而是一个用于表示字符串的 Tagged Pointer;
    2. 用了 18 个 16 进制位来表示 ASCII 码,因此,最多可以表示 9 个 ASCII 字符,这也是为什么超过 9 位的字符串将转为使用堆内存存储;
    3. 是用 1 个 16进制位来表示字符串的长度;

    上代码:

    NSString *string1 = [NSString stringWithFormat:@"%@",@"123"];
    NSString *string2 = [NSString stringWithFormat:@"%@",@"124"];
    NSString *string3 = [NSString stringWithFormat:@"%@",@"125"];
    NSString *string4 = [NSString stringWithFormat:@"%@",@"1256"];
    NSString *string5 = [NSString stringWithFormat:@"%@",@"2256"];
    NSString *string6 = [NSString stringWithFormat:@"%@",@"abc"];
    

    先看 string1 - string6 的内存地址:

    2021-02-25 11:32:32.140 XKStringTest[59022:15957079] string1:0xa000000003332313
    2021-02-25 11:32:32.143 XKStringTest[59022:15957079] string2:0xa000000003432313
    2021-02-25 11:32:32.144 XKStringTest[59022:15957079] string3:0xa000000003532313
    2021-02-25 11:32:32.145 XKStringTest[59022:15957079] string4:0xa000000363532314
    2021-02-25 11:32:32.146 XKStringTest[59022:15957079] string5:0xa000000363532324
    2021-02-25 11:32:32.147 XKStringTest[59022:15957079] string6:0xa000000006362613
    

    就 string1 而言,最后一位 “3” 表示字符串的长度,而 33、32、31 转化成 10 进制依次为:51、50、49,查询 ASCII 表:

    ASCII

    所以,0xa000000003332313 即表示 123,再看 string6,同理,61,62,63 分别表示 a、b、c,其他的自行推证;

    总结:

    • 18个进制位按照倒序方式,每两个 16 进制位表示一个字符串所对应的 ASCII 字符;

    继续看代码:

    NSString *string7 = [NSString stringWithFormat:@"%@",@"1234567"];
    NSString *string8 = [NSString stringWithFormat:@"%@",@"12345678"];
    NSString *string9 = [NSString stringWithFormat:@"%@",@"abcdefghi"];
    NSString *string10 = [NSString stringWithFormat:@"%@",@"1234567890"];
    

    打印结果:

    2021-02-25 11:39:23.384 XKStringTest[59049:15960223] string7:0xa373635343332317
    2021-02-25 11:39:23.388 XKStringTest[59049:15960223] string8:0xa007a87dcaecc2a8
    2021-02-25 11:39:23.389 XKStringTest[59049:15960223] string9:0xa0880e28045a5419
    2021-02-25 11:39:23.390 XKStringTest[59049:15960223] string10:0x60000002bee0
    

    从上可以看到,当字符串长度为 10 时,内存地址发生了显著变化,而这个明显就是堆内存地址,可以打印内存地址验证:

    NSString *constString = @"123";
    NSLog(@"常量区地址:%p",constString);
    NSLog(@"栈地址:%p",&string10);
    NSLog(@"堆地址:%p",string10);
    NSLog(@"Tagged Pointer:%p",string9);
    

    输出结果:

    2021-02-25 11:42:11.609 XKStringTest[59110:15962307] 常量区地址:0x1009db160
    2021-02-25 11:42:11.610 XKStringTest[59110:15962307] 栈地址:0x7ffeef226340
    2021-02-25 11:42:11.611 XKStringTest[59110:15962307] 堆地址:0x60800002d1c0
    2021-02-25 11:42:11.611 XKStringTest[59110:15962307] Tagged Pointer:0xa0880e28045a5419
    

    总结:

    • Tagger Pointer 最多表示长度为 9 的字符串;

    三、堆内存

    根据上面的示例,已经可以下结论:

    • 使用 init 方法生成的字符串,如果大于 9 位,则以堆内存的形式存储;

    可能 NSString 的各种方法有潜规则,有可能有不使用 Tagged Pointer 的方法,此时即使是长度小于 9 的字符串,也可能是存在堆内存中,这里就不去深究了,遇到了再具体看就行。

    还需要提一嘴的是:

    NSString 对象在堆内存中不是从内存地址的一开始就是表示字符串的,比如 string10(@"1234567890") 查看堆内存的表现是:

    堆内存图

    这也很好理解,应为 NSString 为 NSObject,还有一些其他的属性需要表示,根据一些重排规则(比如struct 内存对齐、比如 Apple 的内存重排优化)排在前面也不可厚非;

    四、总结

    总结:

    1. iOS 中的字符串以常量、Tagged Pointer、堆内存的三种形式存在;
    2. Tagged Pointer 最多表示 9 个字符串;

    相关文章

      网友评论

          本文标题:iOS:Tagged Pointer

          本文链接:https://www.haomeiwen.com/subject/uomsfltx.html