美文网首页ceph
v14.2.5 Nautilus 发布

v14.2.5 Nautilus 发布

作者: ming416 | 来源:发表于2019-12-11 15:01 被阅读0次

    Nautilus v14.2.5发布

    这是Ceph Nautilus版本系列的第五个版本。在许多值得注意的更改中,此版本修复了
    14.2.3 中引入的严重BlueStore错误。建议所有Nautilus用户升级到此版本。

    显着的变化

    关键修复:

    • 此版本修复了一个重要的BlueStore错误该错误在14.2.3中引入(并且在14.2.4中也存在),当使用单独的“ WAL”设备时,该错误可能导致数据损坏。

    新的健康警告:

    • 如果守护程序最近崩溃,Ceph现在将发出运行状况警告。
      自Nautilus最初发布以来,Ceph 就一直在收集崩溃报告,但是
      运行状况警报是新的。要查看新的崩溃(或所有崩溃,如果您刚刚
      升级的话):

      ceph crash ls-new
      

      要确认特定的崩溃(或所有崩溃)并使运行状况警告静音:

      ceph crash archive-all
      
    • 如果RADOS池的pg_num 值不是2的幂,Ceph现在将发出健康警告。可以通过将池调整为附近的2的幂来解决此问题:

          ceph osd pool set <pool-name> pg_num <new-pg-num>
      

      或者,可以通过以下方式使警告静音:

      ceph config set global mon_warn_on_pool_pg_num_not_power_of_two false
      
    • 如果将RADOS池的size设置为1,
      或者换句话说,如果该池配置为没有冗余,则Ceph将发出健康警告。
      如果池大小设置为最小
      建议值,则Ceph将停止发出警告:

      ceph osd pool set <pool-name> size <num-replicas>
      

      可以通过以下方式使警告静音:

      ceph config set global mon_warn_on_pool_no_redundancy false
      
    • 如果平均osd心跳ping
      时间超过所计算的任何间隔的可配置阈值,现在就会生成健康警告。OSD计算平均值,最小值和最大值的1分钟,5分钟和15分钟间隔。新的配置选项mon_warn_on_slow_ping_ratio指定的百分比osd_heartbeat_grace来确定阈值。零值将禁用警告。 以毫秒为单位指定的新配置选项mon_warn_on_slow_ping_time会 覆盖计算值,并在OSD心跳ping花费的时间超过指定的数量时引发警告。
      新的管理命令ceph守护程序mgr。

        #dump_osd_network [阈值],
      

    将列出所有ping时间长于config选项确定的指定阈值或值的所有连接,以3个间隔中任意间隔的平均值为准。
    另一种新的管理命令,ceph daemon OSD。

    #dump_osd_network [门槛]</cite>,
    

    将做由指定的OSD开始同时但只包括心跳。

    telemetry 模块中的更改:

    • telemetry 模块现在具有默认启用的“设备”通道,该通道将向telemetry.ceph.com报告匿名的硬盘和SSD健康指标,以构建和改进设备故障预测算法。由于telemetry 报告的内容已更改,因此您需要通过以下方式重新选择加入

      ceph telemetry on
      

    您可以通过以下方式确切查看将首先报告哪些信息:

      ceph telemetry show
      ceph telemetry show device   # specifically show the device channel
    

    如果您不愿意共享设备指标,则可以先停用该频道,然后再重新启用:

    ceph config set mgr mgr/telemetry/channel_device false
    ceph telemetry on
    
    • telemetry 模块现在报告有关CephFS文件系统的更多信息,
      包括:

      • 多少个MDS守护程序(总计和每个文件系统)
      • 启用(或已启用)哪些功能
      • 多少个数据池
      • 文件系统的大致年龄(年份+创建月份)
      • 多少个文件,字节和快照
      • 缓存了多少元数据

      我们还添加了:

      • 监视器正在运行哪个Ceph版本
      • 监视器是否使用msgr v1或v2地址
      • 监视器使用的是IPv4还是IPv6地址
      • 是否启用RADOS缓存分层(以及哪种模式)
      • 是否复制池或对擦除进行编码,以及
        正在使用哪个擦除代码配置文件插件和参数
      • 集群中有多少台主机,每种类型的守护程序有多少台主机
      • 是否正在使用单独的OSD群集网络
      • 集群中有多少个RBD池和映像,以及有多少个池启用了RBD镜像
      • 存在多少个RGW守护程序,区域和区域组;正在使用哪些RGW前端
      • 有关CRUSH映射的汇总统计信息,例如使用了哪些算法,有多少个
        存储桶,定义了多少个规则以及
        使用了什么可调参数

      如果启用了telemetry 功能,则需要使用以下选项重新加入:

      ceph telemetry on
      

      您可以通过以下方式确切查看将首先报告哪些信息:

      ceph telemetry show        # see everything
      ceph telemetry show basic  # basic cluster info (including all of the new info)
      

    OSD:

    • 一个新的OSD守护程序命令“ dump_recovery_reservations”显示
      在优先级队列中持有的(in_progress)和等待中的恢复锁。
    • 另一个新的OSD守护程序命令“ dump_scrub_reservations”显示了
      为本地(主要)和远程(副本)PG保留的清理保留。

    RGW:

    • RGW现在支持S3对象锁API集,允许使用WORM模型
      存储对象。添加了6个新的API,放置/获取存储桶对象锁定,
      放置/获取对象保留,放置/获取对象合法保留。
    • RGW现在支持列表对象V2

    相关文章

      网友评论

        本文标题:v14.2.5 Nautilus 发布

        本文链接:https://www.haomeiwen.com/subject/gswogctx.html