美文网首页
C++对象模型2——类对象的数据布局

C++对象模型2——类对象的数据布局

作者: 漫游之光 | 来源:发表于2018-12-09 15:08 被阅读0次

没有继承的类对象的数据布局

一个类如果没有父类,那么它的数据布局相对简单,有以下的注意点:

  1. 一个空类的大小是1个字节(需要能对对象取地址)。
  2. 类的非静态成员变量存储在对象内部,静态成员变量存储在类对象外部。
  3. 成员函数,不管是静态的还是非静态的,都存储在类外部。
  4. 虚函数存储在类对象的外部,但是类对象中需要存储一个指针指向虚函数表。
  5. 由于在计算机中需要字节对齐,所以类可能比成员相加之和更大。

如果要访问这些类对象,可以采用指针的偏移,然后按照类型取值就可以,下面是一个例子:

#include <iostream>
using namespace std;

class A{
public:
    char grade = 'A';
    const char* name = "Jack";
    int age = 18;
    static int id;

    virtual void f1(){
        cout << "A::f1()" << endl;
    }

    virtual void f2(){
        cout << "A::f2()" << endl;
    }

    void f3(){
        cout << "A::f3()" << endl;
    }

    void f4(){
        cout << "A::f4()" << endl;
    }
};

int A::id = 1;

int main(){
    A a;
    printf("grade %d\tname %d\tage %d\n", &A::grade, &A::name, &A::age);
    char *pa = (char *)&a;
    pa += 8;
    printf("grade = %c\n", *pa);
    pa += 8;
    printf("name = %s\n", *((char* *)pa));
    pa += 8;
    printf("age = %d\n", *( (int *) pa));

    A *ap = &a;
    ap->age = 19;
    return 0;
}

可以使用对类的成员取地址的方式得到成员在类中的偏移,也可以使用前面说的命令:

cl /d1 reportSingleClassLayoutA object_size.cpp

来得到如下所示的类布局:

class A size(32):
        +---
 0      | {vfptr}
 8      | grade
        | <alignment member> (size=7)
16      | name
24      | age
        | <alignment member> (size=4)
        +---

A::$vftable@:
        | &A_meta
        |  0
 0      | &A::f1
 1      | &A::f2

可以看出,有虚函数会生成一个虚函数指针放在类对象的开头,字节对齐会导致编译器会填充一些空白到类对象中。

这里还演示知道这个成员的偏移怎么通过指针取出值来,其实比较简单,就是手动偏移指针,然后对指针的类型进行强转就可以了。其实编译器内部也差不多是这么实现的。可以设置年龄这里加一个断点,然后调试,在VS2013中,调试->窗口->反汇编,就可以看到汇编代码。

    ap->age = 19;
00007FF6DF024A8C  mov         rax,qword ptr [ap]  
00007FF6DF024A91  mov         dword ptr [rax+18h],13h

可以看出,在汇编代码中,也是吧13h(19)这个值直接mov到rax(a的首地址)+18h(24)的地方。

指向数据对象的指针

这个只是展示一些比较奇怪的用法,平时用的比较少。请看下面的代码:

#include<iostream>
using namespace std;

class A{
public:
    char c = 'a';
    int i = 1;
    long l = 1L;
};

int main(){
    /* 得到的其实是成员在类中的偏移 */
    printf("&A::c = %d,&A::i = %d,&A::l = %d\n",&A::c,&A::i,&A::l);
    int A::*p = &A::i; /* 声明一个指向类成员的指针 */
    A a;
    printf("a.*p = %d\n", a.*p); /* 使用指向类成员的指针 */
    return 0;
}

有继承的类对象的数据布局

如果一个类继承了父类,这个类对象的布局有新的一些特点,不同的编译器有不同的方案,但基本的思想是不变的,主要体现为以下两点:

  1. 子类含有父类的所有成员。
  2. 通过调整子对象的指针,可以得到一个大于等于父类的布局(可以在后面增加成员,但前面必须保持一致)。

和没有继承的类相比,有了继承之后编译器的处理方案会多很多,所以这里只是举一个例子来说明。

#include <iostream>
using namespace std;

class A{
public:
    const char *aname = "class A";
    int a1 = 100;
    void printA(){
        printf("name = %s,val = %d\n", aname, a1);
    }
};

class B{
public:
    const char *bname = "class B";
    int b1 = 200;

    void printB(){
        printf("name = %s,val = %d\n", bname, b1);
    }
    virtual void f(){
        cout << "B::f()" << endl;
    }
};

class C :public A, public B{
public:
    char c = 'A';
    virtual void printC(){
        cout << "class C :public A, public B" << endl;
    }
};


int main(){
    C c;
    char *p = (char *)&c;
    B *pb = (B *)p;
    pb->printB();
    p += 24;
    A *pa = (A *)p;
    pa->printA();
    A *pa1 = &c;
    B *pb1 = &c;
    printf("pa = %p,pa1 = %p;pb = %p,pb1 = %p\n", pa, pa1, pb, pb1);
    p = (char *)&c;
    p += 16;
    B *pa2 = (B *)p;
    pa2->printB();
    return 0;
}

使用命令得到数据的布局:

class C size(48):
        +---
        | +--- (base class B)
 0      | | {vfptr}
 8      | | bname
16      | | b1
        | | <alignment member> (size=4)
        | +---
        | +--- (base class A)
24      | | aname
32      | | a1
        | | <alignment member> (size=4)
        | +---
40      | c
        | <alignment member> (size=7)
        +---

C::$vftable@:
        | &C_meta
        |  0
 0      | &B::printB
 1      | &C::printC

从布局中可以看出一些东西,第一,布局并没有按照继承顺序,先继承了A,但是却把B排到了前面;第二,修改了虚函数表,在B的虚函数表后面增加了C的虚函数。

这里可以看出,它满足上面说的两个条件,可以把c的首地址当做B使用,可以把c的首地址偏移24当做A使用。上面的测试代码说明了这一点。值得注意的是,不能使用cout输出,具体原因不清楚,感觉是cout有更加严格的类型检查。最后,还做了一个操作,把c偏移16当做一个B使用,可以看到,这一点也是可以正确运行的,只不过打印的是A的参数。

有虚继承的类对象的数据布局

先看看如果不使用虚继承会出现的问题,先看下面的代码:

#include <iostream>
using namespace std;

class A{
public:
    int val = 100;
};

class B1 :public A{
public:
    int b1 = 200;
};

class B2 :public A{
public:
    int b2 = 300;
};

class C :public B1, public B2{
public:
    int c = 400;
};

有两个问题,第一个是这样继承C中会有两个A的对象,前面说过,子类有父类所有的成员,B1和B2都继承自A,C又继承B1和B2,所以C中就有两个A。可以查看C的布局:

class C size(20):
        +---
        | +--- (base class B1)
        | | +--- (base class A)
 0      | | | val
        | | +---
 4      | | b1
        | +---
        | +--- (base class B2)
        | | +--- (base class A)
 8      | | | val
        | | +---
12      | | b2
        | +---
16      | c
        +---

第二个是如果使用c.val访问会产生歧义,因为有两个val,只能指定作用域,如c.A::val来访问。

虚继承可以解决这个问题,使得虚继承的类在继承体系中只有一个。但这样在实现上又有一个问题,上面说过,要支持多态,那么就需要能够通过调整this指针达到以假乱真的地步。如果少一个对象A,你会发现无论怎么调整指针,B1和B2始终有一个不能满足。

在VS2013中,对虚继承的实现有一点技巧,大致的思想是,不再直接保存A,而是保存A的指针。这样的好处是,虽然有出现了两个A,但两个A都指向了同一个地方,并且,指针的大小应该是远远小于类的大小。并且,对于A的访问,只能通过保存的指针访问,而不能直接通过偏移访问。那么A保存在哪呢?其实就可以保存在类的后面,因为不会访问,也更紧凑,那么前面的指针就可以是一个偏移。

把上面的继承改为虚继承,再看看C的数据布局。

class C size(44):
        +---
        | +--- (base class B1)
 0      | | {vbptr}
 8      | | b1
        | | <alignment member> (size=4)
        | | <alignment member> (size=4)
        | +---
        | +--- (base class B2)
16      | | {vbptr}
24      | | b2
        | | <alignment member> (size=4)
        | | <alignment member> (size=4)
        | +---
32      | c
        | <alignment member> (size=4)
        +---
        +--- (virtual base A)
40      | val
        +---

C::$vbtable@B1@:
 0      | 0
 1      | 40 (Cd(B1+0)A)

C::$vbtable@B2@:
 0      | 0
 1      | 24 (Cd(B2+0)A)

在看看B1的布局:

class B1        size(20):
        +---
 0      | {vbptr}
 8      | b1
        | <alignment member> (size=4)
        +---
        +--- (virtual base A)
16      | val
        +---

B1::$vbtable@:
 0      | 0
 1      | 16 (B1d(B1+0)A)

可以看出,经过这样修改,就满足这个修改指针的条件。然后再看看对于val的访问:

int main(){
    C c;
    c.val = 1;
    return 0;
}

对应的反汇编代码为:

    c.val = 1;
00007FF6D4DC49A6  mov         rax,qword ptr [c]  
00007FF6D4DC49AB  movsxd      rax,dword ptr [rax+4]  
00007FF6D4DC49AF  mov         dword ptr c[rax],1 

通过汇编,可以看出,对于val的访问,是通过vbptr找到偏移,然后通过偏移找到A,然后通过val在A中偏移(这里的偏移是0,没有体现出来),在进行赋值。

关于虚继承的数据布局,其实还有很多细节,但是个人认为,还是不应该纠结于细节,要抓住主要思想。

运行时类型识别(RTTI)

之所以在这里讲RTTI,是因为RTTI和对象的布局是有关系的。要实现RTTI,也许第一个想到的办法就是在对象里面增加一个字段,指向一个type_info对象的地址,type_info每个类可以在编译时确定,但是这样的代价太高了。所以,处于折中的考虑,就把type_info和虚函数表放在一起,这样可以节约空间,但是,这样的问题是,对于没有虚函数的类,使用typeid得到的类型是有问题的。

#include<iostream>
using namespace std;

class A{
public:
    int a;
    virtual void func(){}
};

class B :public A{
public:
    int b;
};

int main(){
    A *a = new B();
    const type_info &info = typeid(*a);
    cout << info.name() << endl;
    return 0;
}

如果去掉A中的虚函数,那么输出为class A,也就是编译时的类型。至于这个type_info指针的位置,也就不深究了,不同的编译器有不同的方案,知道大致的原理就行。如果想要知道的话,可以查看反汇编代码,应该就可以知道存放的位置了。

相关文章

网友评论

      本文标题:C++对象模型2——类对象的数据布局

      本文链接:https://www.haomeiwen.com/subject/jzzzcqtx.html