美文网首页云计算
ceph pgp_num 未能更新的问题

ceph pgp_num 未能更新的问题

作者: cloudFans | 来源:发表于2022-08-16 08:55 被阅读0次

由于ceph 17 ceph-adm的池和集群自动平衡有问题,导致pg_num 和 pgp_num未自动调整。所以需要手动调整,
未调整之前pg_num 和 pgp_num 都为1,一个pool 只有一个pg,导致该pool只映射(hash)到两个osd,导致所有磁盘的读写都集中到了两个osd上,随着并发虚拟机的读写请求变多,性能触发瓶颈。 原本一个30s能建好的虚拟机,10分钟才较好。

这种方式只能先手动调大pg_num和pgp_num 比如pgp_num 增大到64. 但是由于先执行另一个osd reweight的操作,触发了数据迁移,导致pgp_num 未能立刻更新。

解决方式:

image.png

参考: https://www.mail-archive.com/ceph-users@ceph.io/msg06755.html

临时解决方式:


image.png

但是新旧版本的ceph 配置方式有变化,这个是比较老的配置方式

pgp_num的扩充方式:

image.png

这个指标一旦小于5%就会扩充4个pgp_num出来,实际上这个是整个集群的pgp_num上限也在增加,当有多个池不一致的时候,
多个池都会平均分配可以扩充的pgp_num。 所以这个扩容pgp_num的操作,最好一个池一个池的进行,这样可以优先恢复一个池的性能。其他池不操作,性能会保持不变。而且pgp_num扩充的时候,设计osd再平衡,会有数据迁移,性能肯定会更差一些。

image.png

相关文章

网友评论

    本文标题:ceph pgp_num 未能更新的问题

    本文链接:https://www.haomeiwen.com/subject/gzjrgrtx.html