C++对象模型2——类对象的数据布局

作者: 漫游之光 | 来源:发表于2018-12-09 15:08 被阅读0次

C++对象模型2——类对象的数据布局
C++面向对象编程（下）第二周笔记 GeekBand
慕课网-C++远征之封装篇（下）-学习笔记
数据类型检测 in、delete关键字逻辑短路原型
C++面向对象高级编程（下）第三周
C++编程知识分享：C++对象模型（一）
《深入探索C++对象模型》笔记 Chapter3 成员变量
《深入探索C++对象模型》笔记 Chapter2 构造函数
对象的分类
[GeekBand] C++面向对象高级编程-2

没有继承的类对象的数据布局

一个类如果没有父类，那么它的数据布局相对简单，有以下的注意点：

一个空类的大小是1个字节（需要能对对象取地址）。
类的非静态成员变量存储在对象内部，静态成员变量存储在类对象外部。
成员函数，不管是静态的还是非静态的，都存储在类外部。
虚函数存储在类对象的外部，但是类对象中需要存储一个指针指向虚函数表。
由于在计算机中需要字节对齐，所以类可能比成员相加之和更大。

如果要访问这些类对象，可以采用指针的偏移，然后按照类型取值就可以，下面是一个例子：

#include <iostream>
using namespace std;

class A{
public:
    char grade = 'A';
    const char* name = "Jack";
    int age = 18;
    static int id;

    virtual void f1(){
        cout << "A::f1()" << endl;
    }

    virtual void f2(){
        cout << "A::f2()" << endl;
    }

    void f3(){
        cout << "A::f3()" << endl;
    }

    void f4(){
        cout << "A::f4()" << endl;
    }
};

int A::id = 1;

int main(){
    A a;
    printf("grade %d\tname %d\tage %d\n", &A::grade, &A::name, &A::age);
    char *pa = (char *)&a;
    pa += 8;
    printf("grade = %c\n", *pa);
    pa += 8;
    printf("name = %s\n", *((char* *)pa));
    pa += 8;
    printf("age = %d\n", *( (int *) pa));

    A *ap = &a;
    ap->age = 19;
    return 0;
}

可以使用对类的成员取地址的方式得到成员在类中的偏移，也可以使用前面说的命令：

cl /d1 reportSingleClassLayoutA object_size.cpp

来得到如下所示的类布局：

class A size(32):
        +---
 0      | {vfptr}
 8      | grade
        | <alignment member> (size=7)
16      | name
24      | age
        | <alignment member> (size=4)
        +---

A::$vftable@:
        | &A_meta
        |  0
 0      | &A::f1
 1      | &A::f2

可以看出，有虚函数会生成一个虚函数指针放在类对象的开头，字节对齐会导致编译器会填充一些空白到类对象中。

这里还演示知道这个成员的偏移怎么通过指针取出值来，其实比较简单，就是手动偏移指针，然后对指针的类型进行强转就可以了。其实编译器内部也差不多是这么实现的。可以设置年龄这里加一个断点，然后调试，在VS2013中，调试->窗口->反汇编，就可以看到汇编代码。

    ap->age = 19;
00007FF6DF024A8C  mov         rax,qword ptr [ap]  
00007FF6DF024A91  mov         dword ptr [rax+18h],13h

可以看出，在汇编代码中，也是吧13h（19）这个值直接mov到rax（a的首地址）+18h（24）的地方。

指向数据对象的指针

这个只是展示一些比较奇怪的用法，平时用的比较少。请看下面的代码：

#include<iostream>
using namespace std;

class A{
public:
    char c = 'a';
    int i = 1;
    long l = 1L;
};

int main(){
    /* 得到的其实是成员在类中的偏移 */
    printf("&A::c = %d,&A::i = %d,&A::l = %d\n",&A::c,&A::i,&A::l);
    int A::*p = &A::i; /* 声明一个指向类成员的指针 */
    A a;
    printf("a.*p = %d\n", a.*p); /* 使用指向类成员的指针 */
    return 0;
}

有继承的类对象的数据布局

如果一个类继承了父类，这个类对象的布局有新的一些特点，不同的编译器有不同的方案，但基本的思想是不变的，主要体现为以下两点：

子类含有父类的所有成员。
通过调整子对象的指针，可以得到一个大于等于父类的布局（可以在后面增加成员，但前面必须保持一致）。

和没有继承的类相比，有了继承之后编译器的处理方案会多很多，所以这里只是举一个例子来说明。

#include <iostream>
using namespace std;

class A{
public:
    const char *aname = "class A";
    int a1 = 100;
    void printA(){
        printf("name = %s,val = %d\n", aname, a1);
    }
};

class B{
public:
    const char *bname = "class B";
    int b1 = 200;

    void printB(){
        printf("name = %s,val = %d\n", bname, b1);
    }
    virtual void f(){
        cout << "B::f()" << endl;
    }
};

class C :public A, public B{
public:
    char c = 'A';
    virtual void printC(){
        cout << "class C :public A, public B" << endl;
    }
};


int main(){
    C c;
    char *p = (char *)&c;
    B *pb = (B *)p;
    pb->printB();
    p += 24;
    A *pa = (A *)p;
    pa->printA();
    A *pa1 = &c;
    B *pb1 = &c;
    printf("pa = %p,pa1 = %p;pb = %p,pb1 = %p\n", pa, pa1, pb, pb1);
    p = (char *)&c;
    p += 16;
    B *pa2 = (B *)p;
    pa2->printB();
    return 0;
}

使用命令得到数据的布局：

class C size(48):
        +---
        | +--- (base class B)
 0      | | {vfptr}
 8      | | bname
16      | | b1
        | | <alignment member> (size=4)
        | +---
        | +--- (base class A)
24      | | aname
32      | | a1
        | | <alignment member> (size=4)
        | +---
40      | c
        | <alignment member> (size=7)
        +---

C::$vftable@:
        | &C_meta
        |  0
 0      | &B::printB
 1      | &C::printC

从布局中可以看出一些东西，第一，布局并没有按照继承顺序，先继承了A，但是却把B排到了前面；第二，修改了虚函数表，在B的虚函数表后面增加了C的虚函数。

这里可以看出，它满足上面说的两个条件，可以把c的首地址当做B使用，可以把c的首地址偏移24当做A使用。上面的测试代码说明了这一点。值得注意的是，不能使用cout输出，具体原因不清楚，感觉是cout有更加严格的类型检查。最后，还做了一个操作，把c偏移16当做一个B使用，可以看到，这一点也是可以正确运行的，只不过打印的是A的参数。

有虚继承的类对象的数据布局

先看看如果不使用虚继承会出现的问题，先看下面的代码：

#include <iostream>
using namespace std;

class A{
public:
    int val = 100;
};

class B1 :public A{
public:
    int b1 = 200;
};

class B2 :public A{
public:
    int b2 = 300;
};

class C :public B1, public B2{
public:
    int c = 400;
};

有两个问题，第一个是这样继承C中会有两个A的对象，前面说过，子类有父类所有的成员，B1和B2都继承自A，C又继承B1和B2，所以C中就有两个A。可以查看C的布局：

class C size(20):
        +---
        | +--- (base class B1)
        | | +--- (base class A)
 0      | | | val
        | | +---
 4      | | b1
        | +---
        | +--- (base class B2)
        | | +--- (base class A)
 8      | | | val
        | | +---
12      | | b2
        | +---
16      | c
        +---

第二个是如果使用c.val访问会产生歧义，因为有两个val，只能指定作用域，如c.A::val来访问。

虚继承可以解决这个问题，使得虚继承的类在继承体系中只有一个。但这样在实现上又有一个问题，上面说过，要支持多态，那么就需要能够通过调整this指针达到以假乱真的地步。如果少一个对象A，你会发现无论怎么调整指针，B1和B2始终有一个不能满足。

在VS2013中，对虚继承的实现有一点技巧，大致的思想是，不再直接保存A，而是保存A的指针。这样的好处是，虽然有出现了两个A，但两个A都指向了同一个地方，并且，指针的大小应该是远远小于类的大小。并且，对于A的访问，只能通过保存的指针访问，而不能直接通过偏移访问。那么A保存在哪呢？其实就可以保存在类的后面，因为不会访问，也更紧凑，那么前面的指针就可以是一个偏移。

把上面的继承改为虚继承，再看看C的数据布局。

class C size(44):
        +---
        | +--- (base class B1)
 0      | | {vbptr}
 8      | | b1
        | | <alignment member> (size=4)
        | | <alignment member> (size=4)
        | +---
        | +--- (base class B2)
16      | | {vbptr}
24      | | b2
        | | <alignment member> (size=4)
        | | <alignment member> (size=4)
        | +---
32      | c
        | <alignment member> (size=4)
        +---
        +--- (virtual base A)
40      | val
        +---

C::$vbtable@B1@:
 0      | 0
 1      | 40 (Cd(B1+0)A)

C::$vbtable@B2@:
 0      | 0
 1      | 24 (Cd(B2+0)A)

在看看B1的布局：

class B1        size(20):
        +---
 0      | {vbptr}
 8      | b1
        | <alignment member> (size=4)
        +---
        +--- (virtual base A)
16      | val
        +---

B1::$vbtable@:
 0      | 0
 1      | 16 (B1d(B1+0)A)

可以看出，经过这样修改，就满足这个修改指针的条件。然后再看看对于val的访问：

int main(){
    C c;
    c.val = 1;
    return 0;
}

对应的反汇编代码为：

    c.val = 1;
00007FF6D4DC49A6  mov         rax,qword ptr [c]  
00007FF6D4DC49AB  movsxd      rax,dword ptr [rax+4]  
00007FF6D4DC49AF  mov         dword ptr c[rax],1

通过汇编，可以看出，对于val的访问，是通过vbptr找到偏移，然后通过偏移找到A，然后通过val在A中偏移（这里的偏移是0，没有体现出来），在进行赋值。

关于虚继承的数据布局，其实还有很多细节，但是个人认为，还是不应该纠结于细节，要抓住主要思想。

运行时类型识别（RTTI）

之所以在这里讲RTTI，是因为RTTI和对象的布局是有关系的。要实现RTTI，也许第一个想到的办法就是在对象里面增加一个字段，指向一个type_info对象的地址，type_info每个类可以在编译时确定，但是这样的代价太高了。所以，处于折中的考虑，就把type_info和虚函数表放在一起，这样可以节约空间，但是，这样的问题是，对于没有虚函数的类，使用typeid得到的类型是有问题的。

#include<iostream>
using namespace std;

class A{
public:
    int a;
    virtual void func(){}
};

class B :public A{
public:
    int b;
};

int main(){
    A *a = new B();
    const type_info &info = typeid(*a);
    cout << info.name() << endl;
    return 0;
}

如果去掉A中的虚函数，那么输出为class A，也就是编译时的类型。至于这个type_info指针的位置，也就不深究了，不同的编译器有不同的方案，知道大致的原理就行。如果想要知道的话，可以查看反汇编代码，应该就可以知道存放的位置了。

C++对象模型2——类对象的数据布局
没有继承的类对象的数据布局一个类如果没有父类，那么它的数据布局相对简单，有以下的注意点：一个空类的大小是1个字...
C++面向对象编程（下）第二周笔记 GeekBand
1.对象模型 C++对象模型中，non static数据成员被放置到对象内部，static数据成员，static ...
慕课网-C++远征之封装篇（下）-学习笔记
C++远征之封装篇（下） c++封装概述类 & 对象对象+数据成员 = 对象成员对象 + 数组 = 对象数组...
数据类型检测 in、delete关键字逻辑短路原型
1、js组成： ECMAscript（基础语法）、Dom（文档对象模型）、Bom（浏览器对象模型） 2、数据类...
C++面向对象高级编程（下）第三周
类的大小与对象模型有两个概念可以解释C++对象模型： 1.语言中直接支持面向对象程序设计的部分。 2.对于各种支...
C++编程知识分享：C++对象模型（一）
何为C++对象模型？ C++对象模型可以概括为以下2部分： 1. 语言中直接支持面向对象程序设计的部分 2. 对于...
《深入探索C++对象模型》笔记 Chapter3 成员变量
《深入探索C++对象模型》笔记 Chapter2 构造函数《深入探索C++对象模型》笔记 Chapter3 成员变...
《深入探索C++对象模型》笔记 Chapter2 构造函数
《深入探索C++对象模型》笔记 Chapter2 构造函数《深入探索C++对象模型》笔记 Chapter3 成员变...
对象的分类
对象的分类对象分为实例对象、类对象、元类对象对象的数据结构 1. 实例对象转化成c++代码以后可以发现可...
[GeekBand] C++面向对象高级编程-2
对象模型（Object Model） C++对象的内容分为数据成员（class data members）与成员函...