- 正常情况 compute节点kube-ovn-controller 一般只更新一次 port,少数两次,但是这次遇到一个更新上万次的情况
事发原因 突然感觉 创建虚拟机 创建port 的timeout的失败率很高,一般在并发比较大的情况下,出现概率才会比较高。
所以观察了下neutron-server 到底都在处理什么任务,跟踪一段时间内发现,在频繁更新一个port。
![](https://img.haomeiwen.com/i8091046/caaea900b9e31e22.png)
grep 'OVN reports status up for port' /var/log/kolla/neutron/neutron-server.log | grep '2021-06-29' | cut -d ':' -f 4 | sort | uniq -c
另外两个节点的情况
![](https://img.haomeiwen.com/i8091046/2f1e5d94ea520ac2.png)
![](https://img.haomeiwen.com/i8091046/277d54cb605d0d70.png)
查看compute节点的情况 发现
![](https://img.haomeiwen.com/i8091046/e82fcd9681829e90.png)
![](https://img.haomeiwen.com/i8091046/5d54139204ba9b62.png)
发现该port 的请求量是非常大的,当天的log量已达9G之多。
关于相关的代码逻辑分析消耗
![](https://img.haomeiwen.com/i8091046/0d58db2b810b4c80.png)
可以直观的看到对ovs 的全量list 两次,以及盲目set mysql db,重复的次数越多,自然会消耗连接数。
网友评论