core dump又叫核心转储, 当程序运行过程中发生异常, 程序异常退出时, 由操作系统把程序当前的内存状况存储在一个core文件中, 叫core dump. (linux中如果内存越界会收到SIGSEGV信号,然后就会core dump)
在程序运行的过程中,有的时候我们会遇到Segment fault(段错误)这样的错误。这种看起来比较困难,因为没有任何的栈、trace信息输出。该种类型的错误往往与指针操作相关。往往可以通过这样的方式进行定位。
产生原因
1. 内存访问越界
- 由于使用错误的下标,导致数组访问越界
- 搜索字符串时,依靠字符串结束符来判断字符串是否结束,但是字符串没有正常的使用结束符
- 使用strcpy, strcat, sprintf, strcmp, strcasecmp等字符串操作函数,将目标字符串读/写爆。应该使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函数防止读写越界。
2. 多线程程序使用了线程不安全的函数
3. 多线程读写的数据未加锁保护
对于会被多个线程同时访问的全局数据,应该注意加锁保护,否则很容易造成core dump
4. 非法指针
- 使用空指针
- 随意使用指针转换。一个指向一段内存的指针,除非确定这段内存原先就分配为某种结构或类型,或者这种结构或类型的数组,否则不要将它转换为这种结构或类型的指针,而应该将这段内存拷贝到一个这种结构或类型中,再访问这个结构或类型。这是因为如果这段内存的开始地址不是按照这种结构或类型对齐的,那么访问它时就很容易因为bus error而core dump.
5. 堆栈溢出
不要使用大的局部变量(因为局部变量都分配在栈上),这样容易造成堆栈溢出,破坏系统的栈和堆结构,导致出现莫名其妙的错误。
配置生成 core 文件
- 使用 ulimit -c 查看core开关,如果为0表示关闭,不会生成core文件
- 使用 ulimit -c [filesize] 设置core文件大小,当最小设置为4之后才会生成core文件
- 使用 ulimit -c unlimited 设置core文件大小为不限制,这是常用的做法
- 如果需要开机就执行,则需要将这句命令写到 /etc/profile 等文件。
core文件命名和保存路径
- core文件有默认的名称和路径,但为了方便,我们通常会自己命名和指定保存路径
- 可以通过 /proc/sys/kernel/core_pattern 设置 core 文件名和保存路径,方法如下
echo "/corefile/core-%e-%p-%t" > /proc/sys/kernel/core_pattern
# 参数:
# %p - insert pid into filename 添加pid
# %u - insert current uid into filename 添加当前uid
# %g - insert current gid into filename 添加当前gid
# %s - insert signal that caused the coredump into the filename 添加导致产生core的信号
# %t - insert UNIX time that the coredump occurred into filename 添加core文件生成时的unix时间
# %h - insert hostname where the coredump happened into filename 添加主机名
# %e - insert coredumping executable name into filename 添加命令名。
gdb查看core dump
调用
gdb filename core
filename就是产生core文件的可执行文件,croe就是产生的core文件名
网友评论