造成卡顿的原因最后都会反映到CPU时间上,可以把CPU时间分为两种:系统时间和用户时间。
- 用户时间:执行用户态应用程序代码所消耗的时间
- 系统时间:执行内核态系统调用所消耗的时间,包括I/O、锁、中断以及其他系统调用的时间
CPU性能
获取cpu核心数
cat /sys/devices/system/cpu/possible
获取某个cpu的频率
cat /sys/devices/system/cpu/cpu0/cpufreq/cpuinfo_max_freq
卡顿问题分析指标
查看cpu使用情况
/proc/stat 获取整个系统的CPU使用情况
/proc/[pid]/stat 获取某个进程的CPU使用情况
常用命令
top 查看哪个进程是CPU消耗大户
vmstat 实时动态监视操作系统的虚拟内存和CPU活动
strace 跟踪某个进程所有的系统调用
CPU饱和度
CPU饱和度反应的是线程排队等待CPU的情况,就是CPU的负载情况。
CPU饱和度会跟应用的线程数有关,如果启动的线程过多,容易导致系统不停的切换执行的线程,把时间浪费在上下文切换,每一次CPU上下文切换都需要刷新寄存器和计数器。
查看CPU上下文切换次数
vmstat
或
/proc/[pid]/schedstat
nr_voluntary_switches: 主动上下文切换次数,因为线程无法获取所需资源导致的上下文切换,最普遍的是IO
nr_involuntary_switches: 被动上下文切换次数,线程被系统强制调度导致上下文切换,例如大量线程在抢占CPU
se.statistics.iowait_count:IO等待的次数
se.statistics.iowait_sum:IO等待的时间
线程优先级
线程优先级会影响Android系统的调度策略,它主要是由nice和cgroup类型共同决定的,nice值越低,抢占cpu时间片的能力越强。
注意是否存在高优先级的线程空等低优先级线程,例如主线程等待某个后台线程的锁
Android卡顿排查工具
TraceView
https://developer.android.com/studio/profile/generate-trace-logs
Nanoscope
https://github.com/uber/nanoscope
//安装nanoscope 命令
brew tap uber/nanoscope
brew install nanoscope
nanoscope只工作在Nanoscope模拟器或者安装Nanoscope系统的设备上
nanosscope emulator
//开始追踪adb连接的设备
nanoscope start
限制:
- 需要自己刷ROM,并且当前只支持Nexus 6P,或者采用其提供的x86架构的模拟器
- 默认只支持主线程采集,其他线程需要代码手动设置
systrace
https://source.android.com/devices/tech/debug/systrace?hl=zh-cn
Simpleperf
https://android.googlesource.com/platform/system/extras/+/master/simpleperf/doc/README.md
卡顿现场
java实现
- 获得java线程状态
通过Thread的getState方法可以获取线程状态。
WAITING、TIME_WAITING、BLOCKED都是需要特别注意的状态。
BLOCKED:是线程正在等待获取锁
WAITING: 是线程正在等待其他线程的唤醒动作。当一个线程处于waiting状态时,不仅会释放CPU资源,还会将持有的object锁也同时释放。
- 获得所有线程堆栈
通过Thread.getAllStackTraces()拿到所有线程的堆栈,7.0之后该方法不会返回主线程的堆栈。
BackgroundHandler属于低优先级的后台线程,也就是主线程等待低优先级的后台线程
本质上Java线程的状态其实是Native线程的一种映射。
Java线程Dump分析
《手Q Android线程死锁监控与自动化分析实践》
Java线程状态
- NEW:当线程被创建,还没有调用start方法时,线程就处于NEW状态
- RUNNABLE:该状态表示线程具备所有运行条件,在运行队列中准备操作系统的调度,或者正在运行。
- BLOCKED:线程正在等待获取java对象的监视器,即线程正在等待进入由synchronized保护的方法或者代码块。
- WAITING:处在该线程的状态,正在等待某个事件的发生,只有特定的条件满足,才能获得执行机会。
- TIMED_WAITING:线程调用了限时版本的API,正在等待时间流逝,处在该状态的线程,如果特定的事件发生或者时间流逝完毕,都会回复运行
- TERMINATED:线程执行完毕,执行run方法正常返回,或者抛出了运行时异常而结束,线程都会停留在这个状态。
网友评论