Nautilus v14.2.5发布

这是Ceph Nautilus版本系列的第五个版本。在许多值得注意的更改中，此版本修复了
14.2.3 中引入的严重BlueStore错误。建议所有Nautilus用户升级到此版本。

显着的变化¶

关键修复：

此版本修复了一个重要的BlueStore错误，该错误在14.2.3中引入（并且在14.2.4中也存在），当使用单独的“ WAL”设备时，该错误可能导致数据损坏。

新的健康警告：

如果守护程序最近崩溃，Ceph现在将发出运行状况警告。
自Nautilus最初发布以来，Ceph 就一直在收集崩溃报告，但是
运行状况警报是新的。要查看新的崩溃（或所有崩溃，如果您刚刚
升级的话）：
```
ceph crash ls-new
```
要确认特定的崩溃（或所有崩溃）并使运行状况警告静音：
```
ceph crash archive-all
```
如果RADOS池的pg_num 值不是2的幂，Ceph现在将发出健康警告。可以通过将池调整为附近的2的幂来解决此问题：
```
    ceph osd pool set <pool-name> pg_num <new-pg-num>
```
或者，可以通过以下方式使警告静音：
```
ceph config set global mon_warn_on_pool_pg_num_not_power_of_two false
```
如果将RADOS池的size设置为1，
或者换句话说，如果该池配置为没有冗余，则Ceph将发出健康警告。
如果池大小设置为最小
建议值，则Ceph将停止发出警告：
```
ceph osd pool set <pool-name> size <num-replicas>
```
可以通过以下方式使警告静音：
```
ceph config set global mon_warn_on_pool_no_redundancy false
```
如果平均osd心跳ping
时间超过所计算的任何间隔的可配置阈值，现在就会生成健康警告。OSD计算平均值，最小值和最大值的1分钟，5分钟和15分钟间隔。新的配置选项mon_warn_on_slow_ping_ratio指定的百分比osd_heartbeat_grace来确定阈值。零值将禁用警告。以毫秒为单位指定的新配置选项mon_warn_on_slow_ping_time会覆盖计算值，并在OSD心跳ping花费的时间超过指定的数量时引发警告。
新的管理命令ceph守护程序mgr。
```
  ＃dump_osd_network [阈值]，
```

将列出所有ping时间长于config选项确定的指定阈值或值的所有连接，以3个间隔中任意间隔的平均值为准。
另一种新的管理命令，ceph daemon OSD。

＃dump_osd_network [门槛]</cite>，

将做由指定的OSD开始同时但只包括心跳。

telemetry 模块中的更改：

telemetry 模块现在具有默认启用的“设备”通道，该通道将向telemetry.ceph.com报告匿名的硬盘和SSD健康指标，以构建和改进设备故障预测算法。由于telemetry 报告的内容已更改，因此您需要通过以下方式重新选择加入
：
```
ceph telemetry on
```

您可以通过以下方式确切查看将首先报告哪些信息：

  ceph telemetry show
  ceph telemetry show device   # specifically show the device channel

如果您不愿意共享设备指标，则可以先停用该频道，然后再重新启用：

ceph config set mgr mgr/telemetry/channel_device false
ceph telemetry on

telemetry 模块现在报告有关CephFS文件系统的更多信息，
包括：
- 多少个MDS守护程序（总计和每个文件系统）
- 启用（或已启用）哪些功能
- 多少个数据池
- 文件系统的大致年龄（年份+创建月份）
- 多少个文件，字节和快照
- 缓存了多少元数据
我们还添加了：
- 监视器正在运行哪个Ceph版本
- 监视器是否使用msgr v1或v2地址
- 监视器使用的是IPv4还是IPv6地址
- 是否启用RADOS缓存分层（以及哪种模式）
- 是否复制池或对擦除进行编码，以及
  正在使用哪个擦除代码配置文件插件和参数
- 集群中有多少台主机，每种类型的守护程序有多少台主机
- 是否正在使用单独的OSD群集网络
- 集群中有多少个RBD池和映像，以及有多少个池启用了RBD镜像
- 存在多少个RGW守护程序，区域和区域组；正在使用哪些RGW前端
- 有关CRUSH映射的汇总统计信息，例如使用了哪些算法，有多少个
  存储桶，定义了多少个规则以及
  使用了什么可调参数
如果启用了telemetry 功能，则需要使用以下选项重新加入：
```
ceph telemetry on
```
您可以通过以下方式确切查看将首先报告哪些信息：
```
ceph telemetry show        # see everything
ceph telemetry show basic  # basic cluster info (including all of the new info)
```