美文网首页
CPU性能判断指标---上下文切换,运行队列和使用率

CPU性能判断指标---上下文切换,运行队列和使用率

作者: caoxinyiyi | 来源:发表于2018-09-18 11:52 被阅读141次

    关于CPU,有3个重要的概念:上下文切换(context switchs),运行队列(Run queue)和使用率(utilization)。

    上下文切换:

    目前流行的CPU在同一时间内只能运行一个线程,超线程的处理器可以在同一时间运行多个线程(包括多核CPU),Linux内核会把多核的处理器当作多个单独的CPU来识别。
     一个标准的Linux内核可以支持运行50~50000个进程运行,对于普通的CPU,内核会调度和执行这些进程。每个进程都会分到CPU的时间片来运行,当一个进程用完时间片或者被更高优先级的进程抢占后,它会备份到CPU的运行队列中,同时其他进程在CPU上运行。这个进程切换的过程被称作上下文切换。过多的上下文切换会造成系统很大的开销。

    [work106 ~]$ vmstat
    procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
     r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
     4  0 1874084 3341144 296868 16677400    0    0     0     9    0    0  7  1 91  0  0
    cs表示上下文切换的数量
    
    运行队列

    每个CPU都会维持一个运行队列,理想情况下,调度器会不断让队列中的进程运行。进程不是处在sleep状态就是run able状态。如果CPU过载,就会出现调度器跟不上系统的要求,导致可运行的进程会填满队列。队列愈大,程序执行时间就愈长。

    [work106 ~]$ uptime
     11:44:52 up 839 days, 19:55,  2 users,  load average: 11.11, 10.33, 9.94
    
    "load average" 用来表示运行队列,用top 命令我们可以看到CPU一分钟,5分钟和15分钟内的运行队列的大小。这个值越大表明系统负荷越大。
    
    [work106 ~]$ vmstat
    procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
     r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
     4  0 1874084 3341144 296868 16677400    0    0     0     9    0    0  7  1 91  0  0
    r表示运行队列的大小,r的参考值是:小于4,队列大于4时,表明系统的cpu或内存可能有问题,如果r经常大于4,且id经常少于40,表示cpu的负荷很重。当队列变长时,队列中进程在等待cpu调度执行时所花的时间会变长.
    id参考值: 大于40,如果r经常大于4,且id经常小于40,表示cpu的负荷很重。
    wa 参考值:小于25%,超过25%的wa的值可以表示磁盘子系统可能没有被正确平衡,也可能是磁盘密集工作负载的结果,系统的磁盘或其它I/o可能有问题,可以通过iostat/SAR –C命令进一步分解分析
    
    
    关于时间片和动态优先级

    时间片对于CPU来说是很关键的参数,如果时间片太长,就会使系统的交互性能变差,用户感觉不到并行。如果太短,又会造成系统频繁的上下文切换,使性能下降。对于IO Bound的系统来讲并不需要太长的时间片,因为系统主要是IO操作;而对于CPU Bound的系统来说需要长的时间片以保持cache的有效性。
      每一个进程启动的时候系统都会给出一个默认的优先级,但在运行过程中,系统会根据进程的运行状况不断调整优先级,内核会升高或降低进程的优先级(每次增加或降低5),判断标准是根据进程处于sleep状态的时间。
      IO Bound进程大部分时间在sleep状态,所以内核会调高它的优先级,CPU Bound进程会被内核惩罚降低优先级。因此,如果一个系统上即运行IO Bound进程,又运行CPU Bound进程,会发现,IO Bound进程的性能不会下降,而CPU Bound进程性能会不断下降。

    经验总结:
    top - 12:00:20 up 839 days, 20:11,  2 users,  load average: 10.54, 10.15, 9.87
    Tasks: 228 total,   1 running, 227 sleeping,   0 stopped,   0 zombie
    Cpu(s): 66.0%us,  7.9%sy,  0.0%ni, 25.5%id,  0.5%wa,  0.0%hi,  0.2%si,  0.0%st
    
    1. 对于每一个CPU来说运行队列不要超过3,例如,如果是双核CPU就不要超过6;
    2. 如果CPU在满负荷运行,应该符合下列分布,
      a) User Time:65%~70%, us过大,说明有用户进程占用很多cpu时间,需要进一步的分析其它软硬件因素。
      b) System Time:30%~35%,sy过大,说明系统管理方面花了很多时间,说明该系统中某个子系统产生了瓶颈,需要进一步分析其它软硬件因素。
      c) User Time+System Time ,合理值范围是 60-85%,如果在一个多用户系统中us+sy时间超过85%,则进程可能要花时间在运行队列中等待,响应时间和业务吞吐量会受损害
      d) Idle:0%~5%, CPU完全空闲的百分比
    3. 对于上下文切换要结合CPU使用率来看,如果CPU使用满足上述分布,大量的上下文切换也是可以接受的。
    4. 出现cpu计数器不在范围时,不一定是由于cpu资源不够,因为其他资源的也会引起,例如内存不够时,cpu会忙内存管理的事,表面上可能是cpu的利用为100%

    相关文章

      网友评论

          本文标题:CPU性能判断指标---上下文切换,运行队列和使用率

          本文链接:https://www.haomeiwen.com/subject/jyfunftx.html