在info命令中,可以看到iowait的解释:
Percentage of time that the CPU or CPUs were idle during which the system had an outstanding disk I/O request.
%iowait 表示在一个采样周期内有百分之几的时间属于以下情况:CPU空闲、并且有仍未完成的I/O请求。
内核会周期性的记录CPU时间片使用情况,它首先判断cpu是不是空闲的,如果不是,则判断是在内核态还是用户态;
如果不是,则会判断是否有磁盘I/O请求被当前的CPU发起,如果有则增加iowait的值,如果没有则增加idle的值。
%iowait 升高并不能证明等待I/O的进程数量增多了,也不能证明等待I/O的总时间增加了。
f721836c787531ecc214cd03d5c0be11_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png在I/O完全一样的情况下,CPU忙闲状态的变化就能够影响 %iowait 的大小。
下图我们看到,在CPU繁忙期间发生的I/O,无论有多少,%iowait 的值都是不受影响的(因为 %iowait 的第一个前提条件就是CPU必须空闲);
当CPU繁忙程度下降时,有一部分I/O落入了CPU空闲的时间段内,这就导致了 %iowait 升高。
可见,I/O并没有变化,%iowait 却升高了,原因仅仅是CPU的空闲时间增加了。
请记住,系统中有成百上千的进程数,任何一个进程都可以引起CPU和I/O的变化,因为 %iowait、%idle、%user、%system 等这些指标都是全局性的,并不是特指某个进程。
另一种情形:假设CPU的繁忙状况保持不变的条件下,即使 %iowait 升高也不能说明I/O负载加重了。
如果2个I/O请求依次提交、使得整个时段内始终有I/O在进行,那么 %iowait 是100%;
如果3个I/O请求同时提交,因为系统有能力同时处理多个I/O,所以3个并发的I/O从开始到结束的时间与一个I/O一样,%iowait 的结果只有50%。
2个I/O使 %iowait 达到了100%,3个I/O的 %iowait 却只有50%,显然 %iowait 的高低与I/O的多少没有必然关系,而是与I/O的并发度相关。
所以,仅凭 %iowait 的上升不能得出I/O负载增加的结论。
010cfb9ac172b3e1c27a5a08b924193c_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png%iowait 所含的信息量非常少,它是一个非常模糊的指标,如果看到 %iowait 升高,还需检查I/O量有没有明显增加,avserv/avwait/avque等指标有没有明显增大,应用有没有感觉变慢,如果都没有,就没什么好担心的。
Linux的8种namespace:挂载点、进程、网络、ipc、uts、user、cgroup、time等。其中,cgroup能限额cpu、限额内存、限额磁盘容量,也能限额磁盘io,限制磁盘的读写iops,这会让本身就慢的磁盘用起来更慢。
如果不限制io,完全放开,对于宿主机的磁盘使用,大家就会哄抢,就要看运气!
网友评论