对于C/C++程序员来说,如果程序core dump了,没有core文件就很难知道发生了什么,只能重新更改系统配置,让core文件产生(通常是在.bash_profile中,加上ulimit -c unlimited),以便下次core的时候可以产生core文件,方便调试,除此之外,还是有其他办法的,那就是采用查看dmesg和add2line方式来定位core的位置。
一 dmesg
dmesg
用来显示内核环缓存区内容(kernel-ring buffer),,内核将各种消息放这里。硬件和模块初始化信息填充在这里面,还有程序oom了,或者程序core了,也可以从这里面看到些蛛丝马迹,遇到疑难问题,我挺喜欢用这个命令查看下的,不过如果简单输入dmesg
,打印出来的信息没有具体时间,如下:
[ 6.396632] ip_tables: (C) 2000-2006 Netfilter Core Team
[ 6.397395] systemd[1]: Inserted module 'ip_tables'
[ 6.829500] EXT4-fs (vda1): re-mounted. Opts: (null)
[ 6.971834] systemd-journald[474]: Received request to flush runtime journal from PID 1
[ 7.228993] piix4_smbus 0000:00:01.3: SMBus Host Controller at 0x700, revision 0
[ 7.241443] input: PC Speaker as /devices/platform/pcspkr/input/input5
[ 7.273676] cryptd: max_cpu_qlen set to 1000
[ 7.288223] AVX2 version of gcm_enc/dec engaged.
[ 7.288970] AES CTR mode by8 optimization enabled
[ 7.332362] alg: No test for __gcm-aes-aesni (__driver-gcm-aes-aesni)
[ 7.340363] alg: No test for __generic-gcm-aes-aesni (__driver-generic-gcm-aes-aesni)
[ 7.381571] ppdev: user-space parallel port driver
[ 7.571710] type=1305 audit(1615624005.114:3): audit_pid=712 old=0 auid=4294967295 ses=4294967295 res=1
[ 7.747291] random: crng init done
为了更容易看,可以通过-H参数里面会显示具体时间,加上-L 参数,彩色打印,如下:

二 利用addr2line定位core的位置
写个简单的例子,如下:
#include <stdio.h>
int main(int argc ,char* argv[])
{
int *p = NULL;
*p = 0;
printf(" core\n");
return 0;
}
因为p指针没有分配地址,所以*p =0
会core,输入dmesg
显示如下:
[3307172.176109] 1[10848]: segfault at 0 ip 0000000000400578 sp 00007ffcb052a550 error 6 in 1[400000+1000]
编译下:
g++ -g 1.c -o abc
运行:./abc
,会core,通过dmesg我们来查看下core的信息:

来看下如下信息:
abc[10870]: segfault at 0 ip 0000000000400578 sp 00007fff22cccb60 error 6 in abc[400000+1000]
其中abc
为程序名字,10870
为运行时候的进程ID,segfault at
引起故障的地址为0,ip 表示core的内存地址:0000000000400578 ,sp 后面地址为堆栈指针地址,这个没啥用,
error 6
这个比较重要,是为多种原因的位运算得到的结果:
error code是位运算,说明:
bit2: 值为1表示是用户态程序内存访问越界,值为0表示是内核态程序内存访问越界
bit1: 值为1表示是写操作导致内存访问越界,值为0表示是读操作导致内存访问越界
bit0: 值为1表示没有足够的权限访问非法地址的内容,值为0表示访问的非法地址根本没有对应的页面,也就是无效地址
6换成二进制是:110
即 是用户态程序内存访问越界和写操作导致内存访问越界。
知道指令的地址,就可以查看地址对应的代码位置,命令如下:
[root@iZbp10p2g1civrw4ggigvfZ soft]# addr2line -s -f -e ./abc 0000000000400578
main
1.c:6
顺利定义到代码在1.c文件的第六行。
三 利用addr2line定位库中core的位置
写一个一定会core的代码,如下:
1 #include <stdio.h>
2 #include <stdlib.h>
3
4 int main(int argc ,char* argv[])
5 {
6 char * pstr = NULL;
7 char * pstr2 = (char*)malloc(sizeof(char)*10);
8 memcpy(pstr,pstr2,20);
9 printf(" core\n");
10 return 0;
11 }
运行下dmesg查看core信息:
[3390574.284000] def[18554]: segfault at 0 ip 00007f0c420f8c16 sp 00007fff9e6dee98 error 6 in libc-2.17.so[7f0c41fa2000+1c3000]
由于core的位置在库中,首先库的基地址为:7f0c41fa2000, core的位置为00007f0c420f8c16 ,计算下core的位置在库中的偏移量:
>>> 0x7f0c420f8c16-0x7f0c41fa2000
1403926
>>> hex(1403926)
'0x156c16'
找到动态库,反编译出汇编代码,根据地址进行定位:
objdump -DCgl libc-2.17.so > 1.txt
# 搜索:156c16
vim 1.txt
运气好的话,先上移动可以看到定位到的函数,如果运气一般,还是无法查到具体的core的库函数,如下图:

四 诗词欣赏
炎黄
-- 作者:天涯在小楼 原名:方哲萱 写于2003年左右。
当我登上那古老的城墙,当我抚摸着腐朽的柱梁,
当我兴奋地倚栏远望,总会有一丝酸涩冲上喉头,
总听到有一个声音大声的说:记得吗?你的祖先名叫炎黄。
有人跟我说,曾经有一条大鱼,生活在北冥那个地方,它化作一只巨鸟,在天地之间翱翔。巨鸟有如垂天之云般的翅膀,虽九万里亦可扶摇直上。
圣贤赋予我们可以囊括天宇的胸襟,为我们塑造一个博大恢弘的殿堂。
那时候,有个怪异的青年名叫嵇康,他临刑前,弹奏了一曲绝响,那宽袍博带在风中飞扬,他用了最优雅的姿态面对死亡。
几千年过去,依旧有余音绕梁,只是他不知道,真正断绝的不是曲谱,而是他的傲骨,乃至他身上的衣裳。
我也曾梦回大唐,和一个叫李白的诗人云游四方,他用来下酒的是剑锋上的寒光,他的情人是空中的月亮。
我曾见他在月下徘徊、高歌吟唱,长风吹开他的发带,长袍飘逸宛如仙人模样。
可是后来换了帝王,他用一杯酒捧起了文人,摒弃了武将。他的子孙最终躲进了人间天堂,把大片的土地拱手相让。
然而在寒冷的北方,正有一支军队征战沙场,敌人都说,有岳家军在,我们打不了胜仗。
可叹英雄遭忌,谗士高张,一缕忠魂终于消散在西湖之傍,一个民族的精神就这么无可逆转的消亡。
然而血色夕阳中,我依稀见到,有人把它插进土壤,那是将军用过的,一支宁折不弯的缨枪。
时间的车轮悠悠荡荡,终于在甲申那里失了方向。于是瘦西湖畔,梅花岭上,为纪念这个悲剧建起一座祠堂。
那个叫史可法的文弱书生,他不愿散开高束的发髻,更不能脱去祖先留给他的衣裳,于是他决定与城共存共亡,丢了性命,护了信仰。残酷的杀戮,如山的尸骨,并不能把民族的精神埋葬,有人相信,千百年后,它依然会在中华大地上熠熠发光。
就在千百年后的今天,我坐进麦当劳的厅堂,我穿起古驰牌的时装,我随口唱着《my heart will go on》,却莫名其妙的心伤,因为我听到一个声音大声的说:忘了吗?你的祖先名叫炎黄。
我记得了,一群褐发篮眼的豺狼,带着尖船利炮,拆了我们的庙宇,毁了我们的殿堂。于是百年之后的今天——我们懂得民主自由,却忘了伦理纲常,我们拥有音乐神童,却不识角徵宫商,我们能建起高楼大厦,却容不下一块公德牌坊,我们穿着西服革履,却没了自己的衣裳。
在哪里,那个礼仪之邦?
在哪里,我的汉家儿郎?
为什么我穿起最美丽的衣衫,你却说我行为异常?
为什么我倍加珍惜的汉装,你竟说它属于扶桑?
网友评论