美文网首页
C++对象模型2——类对象的数据布局

C++对象模型2——类对象的数据布局

作者: 漫游之光 | 来源:发表于2018-12-09 15:08 被阅读0次

    没有继承的类对象的数据布局

    一个类如果没有父类,那么它的数据布局相对简单,有以下的注意点:

    1. 一个空类的大小是1个字节(需要能对对象取地址)。
    2. 类的非静态成员变量存储在对象内部,静态成员变量存储在类对象外部。
    3. 成员函数,不管是静态的还是非静态的,都存储在类外部。
    4. 虚函数存储在类对象的外部,但是类对象中需要存储一个指针指向虚函数表。
    5. 由于在计算机中需要字节对齐,所以类可能比成员相加之和更大。

    如果要访问这些类对象,可以采用指针的偏移,然后按照类型取值就可以,下面是一个例子:

    #include <iostream>
    using namespace std;
    
    class A{
    public:
        char grade = 'A';
        const char* name = "Jack";
        int age = 18;
        static int id;
    
        virtual void f1(){
            cout << "A::f1()" << endl;
        }
    
        virtual void f2(){
            cout << "A::f2()" << endl;
        }
    
        void f3(){
            cout << "A::f3()" << endl;
        }
    
        void f4(){
            cout << "A::f4()" << endl;
        }
    };
    
    int A::id = 1;
    
    int main(){
        A a;
        printf("grade %d\tname %d\tage %d\n", &A::grade, &A::name, &A::age);
        char *pa = (char *)&a;
        pa += 8;
        printf("grade = %c\n", *pa);
        pa += 8;
        printf("name = %s\n", *((char* *)pa));
        pa += 8;
        printf("age = %d\n", *( (int *) pa));
    
        A *ap = &a;
        ap->age = 19;
        return 0;
    }
    

    可以使用对类的成员取地址的方式得到成员在类中的偏移,也可以使用前面说的命令:

    cl /d1 reportSingleClassLayoutA object_size.cpp
    

    来得到如下所示的类布局:

    class A size(32):
            +---
     0      | {vfptr}
     8      | grade
            | <alignment member> (size=7)
    16      | name
    24      | age
            | <alignment member> (size=4)
            +---
    
    A::$vftable@:
            | &A_meta
            |  0
     0      | &A::f1
     1      | &A::f2
    

    可以看出,有虚函数会生成一个虚函数指针放在类对象的开头,字节对齐会导致编译器会填充一些空白到类对象中。

    这里还演示知道这个成员的偏移怎么通过指针取出值来,其实比较简单,就是手动偏移指针,然后对指针的类型进行强转就可以了。其实编译器内部也差不多是这么实现的。可以设置年龄这里加一个断点,然后调试,在VS2013中,调试->窗口->反汇编,就可以看到汇编代码。

        ap->age = 19;
    00007FF6DF024A8C  mov         rax,qword ptr [ap]  
    00007FF6DF024A91  mov         dword ptr [rax+18h],13h
    

    可以看出,在汇编代码中,也是吧13h(19)这个值直接mov到rax(a的首地址)+18h(24)的地方。

    指向数据对象的指针

    这个只是展示一些比较奇怪的用法,平时用的比较少。请看下面的代码:

    #include<iostream>
    using namespace std;
    
    class A{
    public:
        char c = 'a';
        int i = 1;
        long l = 1L;
    };
    
    int main(){
        /* 得到的其实是成员在类中的偏移 */
        printf("&A::c = %d,&A::i = %d,&A::l = %d\n",&A::c,&A::i,&A::l);
        int A::*p = &A::i; /* 声明一个指向类成员的指针 */
        A a;
        printf("a.*p = %d\n", a.*p); /* 使用指向类成员的指针 */
        return 0;
    }
    

    有继承的类对象的数据布局

    如果一个类继承了父类,这个类对象的布局有新的一些特点,不同的编译器有不同的方案,但基本的思想是不变的,主要体现为以下两点:

    1. 子类含有父类的所有成员。
    2. 通过调整子对象的指针,可以得到一个大于等于父类的布局(可以在后面增加成员,但前面必须保持一致)。

    和没有继承的类相比,有了继承之后编译器的处理方案会多很多,所以这里只是举一个例子来说明。

    #include <iostream>
    using namespace std;
    
    class A{
    public:
        const char *aname = "class A";
        int a1 = 100;
        void printA(){
            printf("name = %s,val = %d\n", aname, a1);
        }
    };
    
    class B{
    public:
        const char *bname = "class B";
        int b1 = 200;
    
        void printB(){
            printf("name = %s,val = %d\n", bname, b1);
        }
        virtual void f(){
            cout << "B::f()" << endl;
        }
    };
    
    class C :public A, public B{
    public:
        char c = 'A';
        virtual void printC(){
            cout << "class C :public A, public B" << endl;
        }
    };
    
    
    int main(){
        C c;
        char *p = (char *)&c;
        B *pb = (B *)p;
        pb->printB();
        p += 24;
        A *pa = (A *)p;
        pa->printA();
        A *pa1 = &c;
        B *pb1 = &c;
        printf("pa = %p,pa1 = %p;pb = %p,pb1 = %p\n", pa, pa1, pb, pb1);
        p = (char *)&c;
        p += 16;
        B *pa2 = (B *)p;
        pa2->printB();
        return 0;
    }
    

    使用命令得到数据的布局:

    class C size(48):
            +---
            | +--- (base class B)
     0      | | {vfptr}
     8      | | bname
    16      | | b1
            | | <alignment member> (size=4)
            | +---
            | +--- (base class A)
    24      | | aname
    32      | | a1
            | | <alignment member> (size=4)
            | +---
    40      | c
            | <alignment member> (size=7)
            +---
    
    C::$vftable@:
            | &C_meta
            |  0
     0      | &B::printB
     1      | &C::printC
    

    从布局中可以看出一些东西,第一,布局并没有按照继承顺序,先继承了A,但是却把B排到了前面;第二,修改了虚函数表,在B的虚函数表后面增加了C的虚函数。

    这里可以看出,它满足上面说的两个条件,可以把c的首地址当做B使用,可以把c的首地址偏移24当做A使用。上面的测试代码说明了这一点。值得注意的是,不能使用cout输出,具体原因不清楚,感觉是cout有更加严格的类型检查。最后,还做了一个操作,把c偏移16当做一个B使用,可以看到,这一点也是可以正确运行的,只不过打印的是A的参数。

    有虚继承的类对象的数据布局

    先看看如果不使用虚继承会出现的问题,先看下面的代码:

    #include <iostream>
    using namespace std;
    
    class A{
    public:
        int val = 100;
    };
    
    class B1 :public A{
    public:
        int b1 = 200;
    };
    
    class B2 :public A{
    public:
        int b2 = 300;
    };
    
    class C :public B1, public B2{
    public:
        int c = 400;
    };
    

    有两个问题,第一个是这样继承C中会有两个A的对象,前面说过,子类有父类所有的成员,B1和B2都继承自A,C又继承B1和B2,所以C中就有两个A。可以查看C的布局:

    class C size(20):
            +---
            | +--- (base class B1)
            | | +--- (base class A)
     0      | | | val
            | | +---
     4      | | b1
            | +---
            | +--- (base class B2)
            | | +--- (base class A)
     8      | | | val
            | | +---
    12      | | b2
            | +---
    16      | c
            +---
    

    第二个是如果使用c.val访问会产生歧义,因为有两个val,只能指定作用域,如c.A::val来访问。

    虚继承可以解决这个问题,使得虚继承的类在继承体系中只有一个。但这样在实现上又有一个问题,上面说过,要支持多态,那么就需要能够通过调整this指针达到以假乱真的地步。如果少一个对象A,你会发现无论怎么调整指针,B1和B2始终有一个不能满足。

    在VS2013中,对虚继承的实现有一点技巧,大致的思想是,不再直接保存A,而是保存A的指针。这样的好处是,虽然有出现了两个A,但两个A都指向了同一个地方,并且,指针的大小应该是远远小于类的大小。并且,对于A的访问,只能通过保存的指针访问,而不能直接通过偏移访问。那么A保存在哪呢?其实就可以保存在类的后面,因为不会访问,也更紧凑,那么前面的指针就可以是一个偏移。

    把上面的继承改为虚继承,再看看C的数据布局。

    class C size(44):
            +---
            | +--- (base class B1)
     0      | | {vbptr}
     8      | | b1
            | | <alignment member> (size=4)
            | | <alignment member> (size=4)
            | +---
            | +--- (base class B2)
    16      | | {vbptr}
    24      | | b2
            | | <alignment member> (size=4)
            | | <alignment member> (size=4)
            | +---
    32      | c
            | <alignment member> (size=4)
            +---
            +--- (virtual base A)
    40      | val
            +---
    
    C::$vbtable@B1@:
     0      | 0
     1      | 40 (Cd(B1+0)A)
    
    C::$vbtable@B2@:
     0      | 0
     1      | 24 (Cd(B2+0)A)
    

    在看看B1的布局:

    class B1        size(20):
            +---
     0      | {vbptr}
     8      | b1
            | <alignment member> (size=4)
            +---
            +--- (virtual base A)
    16      | val
            +---
    
    B1::$vbtable@:
     0      | 0
     1      | 16 (B1d(B1+0)A)
    

    可以看出,经过这样修改,就满足这个修改指针的条件。然后再看看对于val的访问:

    int main(){
        C c;
        c.val = 1;
        return 0;
    }
    

    对应的反汇编代码为:

        c.val = 1;
    00007FF6D4DC49A6  mov         rax,qword ptr [c]  
    00007FF6D4DC49AB  movsxd      rax,dword ptr [rax+4]  
    00007FF6D4DC49AF  mov         dword ptr c[rax],1 
    

    通过汇编,可以看出,对于val的访问,是通过vbptr找到偏移,然后通过偏移找到A,然后通过val在A中偏移(这里的偏移是0,没有体现出来),在进行赋值。

    关于虚继承的数据布局,其实还有很多细节,但是个人认为,还是不应该纠结于细节,要抓住主要思想。

    运行时类型识别(RTTI)

    之所以在这里讲RTTI,是因为RTTI和对象的布局是有关系的。要实现RTTI,也许第一个想到的办法就是在对象里面增加一个字段,指向一个type_info对象的地址,type_info每个类可以在编译时确定,但是这样的代价太高了。所以,处于折中的考虑,就把type_info和虚函数表放在一起,这样可以节约空间,但是,这样的问题是,对于没有虚函数的类,使用typeid得到的类型是有问题的。

    #include<iostream>
    using namespace std;
    
    class A{
    public:
        int a;
        virtual void func(){}
    };
    
    class B :public A{
    public:
        int b;
    };
    
    int main(){
        A *a = new B();
        const type_info &info = typeid(*a);
        cout << info.name() << endl;
        return 0;
    }
    

    如果去掉A中的虚函数,那么输出为class A,也就是编译时的类型。至于这个type_info指针的位置,也就不深究了,不同的编译器有不同的方案,知道大致的原理就行。如果想要知道的话,可以查看反汇编代码,应该就可以知道存放的位置了。

    相关文章

      网友评论

          本文标题:C++对象模型2——类对象的数据布局

          本文链接:https://www.haomeiwen.com/subject/jzzzcqtx.html