C++ RTTI的typeid()操作符

作者: CodingCode | 来源:发表于2017-05-28 11:18 被阅读78次

首先为什么typeid()我们把它叫做操作符,而不是一个函数呢,答案是因为它就不是一个函数;熟悉C/C++的童鞋立马就会猜,它应该是一个宏,宏展开后可能是一段代码,或者调用另一个函数;我们翻遍C++的代码库也找不到typeid的定义,也就是说它既不是一个宏也不是一个函数。

它是C++内部定义的一个运算符号,属于C++语言本身的特性,不是库,所以我们叫它操作符号;这和C/C++的另一个操作符sizeof()是一样的行为。他们都是编译器负责解释翻译,运行时刻看不到他们的影子,在编译后的汇编代码里就找不到他们的影子了。


以代码为例:

#include <stdio.h>
#include <string.h>
#include <typeinfo>

void foo() {
    long a = sizeof(int);
    const std::type_info & b = typeid(int);
    printf("size=%d, name=[%s]\n", a, b.name());
}

int main(int argc, char * argv[]) {
    foo();
    return 0;
}

运行结果为:
size=4, name=[i]

在看声称的foo()汇编代码:

_Z3foov:
    pushq   %rbp
    movq    %rsp, %rbp
    subq    $16, %rsp
    movq    $4, -16(%rbp)
    movq    $_ZTIi, -8(%rbp)
    movq    -8(%rbp), %rax
    movq    %rax, %rdi
    call    _ZNKSt9type_info4nameEv
    movq    %rax, %rdx
    movq    -16(%rbp), %rax
    movq    %rax, %rsi
    movl    $.LC0, %edi
    movl    $0, %eax
    call    printf
    leave
    ret

这是完整的foo()汇编代码,我们只关注其中的两条指令:

movq    $4, -16(%rbp)
movq    $_ZTIi, -8(%rbp)

这两条指令对应的源代码分别是:

long a = sizeof(int);
const std::type_info & b = typeid(int);

很神奇吧,生成的汇编指令比原高级语言C++还要简单,第一条指令把int的大小4直接算出来赋给变量a,第二条指令也是把一个常量直接赋给变量b。因为编译器在翻译过程中当碰到操作符sizeof和typeid的时候,它就直接完成了这部分的计算功能,把结果赋得输出。

另外我们在生成的汇编代码文件找不到常量$_ZTIi的定义,这个常量定义在C++运行库里面,所以也就是C++知道有这些定义才能直接用。也就是说C++编译器生成的目标文件依赖于C++编译器提供的部分功能函数。

说到这儿,有些童鞋估计可能会想起来以前做项目的时候遇到过的问题,当一个大的工程由多团队多人开发时,各自模块验证都没有问题,集成的时候总是莫名其妙的错误,crash等等,原因当然很多了,而如果不同的团队使用不同的编译器生成目标代码,运行库时,当这些模块集成到一起的时候可能就会由于不同的编译器对各自运行库的需求不一致,导致莫名错误。


接着讨论typeid()如何工作的?typeid的功能是用来得到一个对象的类型定义,据此判断两个类型是否一致。

std::type_info 是在/usr/include/c++/4.4.4/typeinfo里面定义的一个类,这个类只有一个成员const char *__name,加上一个虚函数表指针std::type_info的实际内存大小为16。

看其中定义的两个函数:
const char* name() const;
返回类型的名字,即成员变量__name的值。

bool operator==(const type_info& __arg) const;
比较两个类型是否相同,它不是比较字符串__name的内容值,而是比较两个类型的__name是否指向同一个内存,当然指向同一块内存必然是内存值相同的。

if (typeid(TYPE1) == typeid(TYPE2)) {
  ...
}
else {
  ...
}

注意既然typeid是在编译时刻确定的类型,那么在多态环境下,并不能根据变量指针的实际类型返回,而是返回变量的申明类型:

include <stdio.h>
#include <typeinfo>

class A1 {};
class A2 : public A1 {};

void foo(A1 * a1) {
   printf("a1=%s\n", typeid(a1).name());
}

int main(int argc, char * argv[])
{
   A1 * a1 = new A1();
   A2 * a2 = new A2();
   foo(a1);
   foo(a2);
   return 0;
}

运行结果为

a1=P2A1
a1=P2A1

可见foo()打印出来的结果都是A1而不管实际参数a1是一个A1类型对象,还是一个A2类型对象。


最后我们看一个class A1和A2的type_info是怎么定义的。
函数foo()如下:

_Z3fooP2A1:
    pushq   %rbp
    movq    %rsp, %rbp
    subq    $16, %rsp
    movq    %rdi, -8(%rbp)
    movl    $_ZTIP2A1, %eax
    movq    %rax, %rdi
    call    _ZNKSt9type_info4nameEv
    movq    %rax, %rsi
    movl    $.LC0, %edi
    movl    $0, %eax
    call    printf
    leave
    ret

其中$_ZTIP2A1就是类A1的type_info定义信息。

    .weak   _ZTSP2A1
_ZTSP2A1:
    .string "P2A1"
    .weak   _ZTIP2A1
_ZTIP2A1:
    .quad   _ZTVN10__cxxabiv119__pointer_type_infoE+16
    .quad   _ZTSP2A1

_ZTIP2A1的内容有两个字段,前面我们说过type_info有两个成员,第一个是指向类type_info虚函数表的指针,第二个是指向类型字符串名字的指针。

前面我们提到类型int的type_info定义在生成的目标文件里找不到,因为int是系统类型,C++会把所有的内置类型的type_info组织好定义在库里面,而对于用户自定义的类型的type_info,则在定义数据类型的时候生成。

_ZNKSt9type_info4nameEv是type_info::name()函数的代码,因为函数name()声明成为inline类型,所以汇编代码在此处也可见。


结尾
其实typeid()在做项目过程中很少被直接使用到,我猜更多的应用场景是C++内部使用,比如dynamic_cast函数。

相关文章

网友评论

  • ba05348c7610:看到这篇文章,写的不错。但是有个小问题:
    typeid里面的操作数如果是pointer,它的类型是编译时就可以确定。但是更多的时候,里面的操作数是reference.

    把这个例子改了
    void foo(A1& a1) {
    printf("a1=%s\n", typeid(a1).name());
    }

    int main(int argc, char * argv[])
    {
    A1 * a1 = new A1();
    A2 * a2 = new A2();
    foo(*a1);
    foo(*a2);
    return 0;
    }

    结果就不一样了

本文标题:C++ RTTI的typeid()操作符

本文链接:https://www.haomeiwen.com/subject/umgcfxtx.html