美文网首页kubernetes以及运维开发系列
9. InfluxDB 设置数据保留策略,验证保留的数据存储大小

9. InfluxDB 设置数据保留策略,验证保留的数据存储大小

作者: Devops海洋的渔夫 | 来源:发表于2019-11-30 10:16 被阅读0次

    需求

    在使用Telegraf+InfluxDB+Grafana监控服务器资源的时候,如果influxdb中的数据不设置超时过期的机制的话,那么数据就会默认一直保存。这样一直保存的话,数据量就会导致偏大。
    这时候就要适当调整influxdb的数据存储时长,保留最近一段时间的数据即可。

    1.基本概念说明

    1.1 InfluxDB 数据保留策略说明

    InfluxDB的数据保留策略(RP)用来定义数据在InfluxDB中存放的时间,或者定义保存某个期间的数据。
    一个数据库可以有多个保留策略, 但每个策略必须是独一无二的。

    1.2 InfluxDB数据保留策略目的

    InfluxDB本身不提供数据的删除操作, 因此用来控制数据量的方式就是定义数据保留策略。
    因此定义数据保留策略的目的是让InfluxDB能够知道可以丢弃哪些数据, 节省数据存储空间,避免数据冗余的情况。

    2.操作示例

    2.1 查看数据保留策略

    show retention policies on 数据库名
    

    执行如下:

    # 选择使用telegraf数据库
    > use telegraf;
    Using database telegraf
    > 
    > 
    # 查询数据保留策略
    > show retention policies on telegraf
    name    duration shardGroupDuration replicaN default
    ----    -------- ------------------ -------- -------
    autogen 0s       168h0m0s           1        true
    > 
    

    从查询的结果来看,默认只有一个策略,而上面这个策略的说明了什么信息呢?

    • name 策略名称:默认autogen
    • duration 持续时间: 0s 代表无限制
    • shardGroupDuration shardGroup数据存储时间:shardGroup是InfluxDB的一个基本存储结构, 应该大于这个时间的数据在查询效率上应该有所降低。
    • replicaN 副本个数:1 代表只有一个副本
    • default 是否默认策略:true 代表设置为该数据库的默认策略

    2.2 新建数据保留策略

    # 新建一个策略
    CREATE RETENTION POLICY "策略名称" ON 数据库名 DURATION 时长 REPLICATION 副本个数;
    
    # 新建一个策略并且直接设置为默认策略
    CREATE RETENTION POLICY "策略名称" ON 数据库名 DURATION 时长 REPLICATION 副本个数 DEFAULT;
    

    下面直接新增一个新的默认策略看看,示例如下:

    # 创建新的默认策略之前的策略
    > show retention policies on telegraf
    name    duration shardGroupDuration replicaN default
    ----    -------- ------------------ -------- -------
    autogen 0s       168h0m0s           1        true
    > 
    > 
    # 创建新的默认策略role_01保留数据时长1小时
    > CREATE RETENTION POLICY "role_01" ON telegraf DURATION 1h REPLICATION 1 DEFAULT;
    > 
    # 查看策略的变化
    > show retention policies on telegraf
    name    duration shardGroupDuration replicaN default
    ----    -------- ------------------ -------- -------
    autogen 0s       168h0m0s           1        false
    role_01 1h0m0s   1h0m0s             1        true
    > 
    

    因为默认策略已经修改为role_01,那么如果还想用之前的autogen策略来查询数据,则需要在查询表之前加上策略的名称:"策略名".表名,如下:

    > select * from "autogen".cpu limit 2;
    name: cpu
    time                cpu       host     usage_guest usage_guest_nice usage_idle        usage_iowait        usage_irq usage_nice usage_softirq usage_steal usage_system        usage_user
    ----                ---       ----     ----------- ---------------- ----------        ------------        --------- ---------- ------------- ----------- ------------        ----------
    1574663960000000000 cpu-total locust03 0           0                99.44972486076016 0.05002501250678571 0         0          0             0           0.2501250625248291  0.2501250625430281
    1574663960000000000 cpu0      locust03 0           0                99.59959959921699 0.10010010010243535 0         0          0             0           0.20020020020031867 0.10010010005008706
    > 
    

    2.3 修改数据保留策略

    ALTER RETENTION POLICY "策略名称" ON "数据库名" DURATION 时长
    
    ALTER RETENTION POLICY "策略名称" ON "数据库名" DURATION 时长 DEFAULT
    

    在这里示例修改role_01策略的时长为2h,如下:

    > show retention policies on telegraf
    name    duration shardGroupDuration replicaN default
    ----    -------- ------------------ -------- -------
    autogen 0s       168h0m0s           1        false
    role_01 1h0m0s   1h0m0s             1        true
    > 
    > 
    # 执行修改时长为2小时
    > ALTER RETENTION POLICY "role_01" ON "telegraf" DURATION 2h
    > 
    # 可以看到role_01的duration为2h
    > show retention policies on telegraf
    name    duration shardGroupDuration replicaN default
    ----    -------- ------------------ -------- -------
    autogen 0s       168h0m0s           1        false
    role_01 2h0m0s   1h0m0s             1        true
    > 
    

    2.4 删除数据保留策略

    drop retention POLICY "策略名" ON "数据库名"
    

    示例删除role_01策略,如下:

    # 查看当前的数据保留策略
    > show retention policies on telegraf
    name    duration shardGroupDuration replicaN default
    ----    -------- ------------------ -------- -------
    autogen 0s       168h0m0s           1        false
    role_01 2h0m0s   1h0m0s             1        true
    > 
    # 删除role_01的策略
    > drop retention POLICY "role_01" ON "telegraf"
    > 
    # 查看删除后的策略,可以看到剩余的策略autogen并不会自动设置为默认default策略
    > show retention policies on telegraf
    name    duration shardGroupDuration replicaN default
    ----    -------- ------------------ -------- -------
    autogen 0s       168h0m0s           1        false
    > 
    # 修改autogen策略为default策略
    > ALTER RETENTION POLICY "autogen" ON "telegraf"  DEFAULT
    > 
    > show retention policies on telegraf
    name    duration shardGroupDuration replicaN default
    ----    -------- ------------------ -------- -------
    autogen 0s       168h0m0s           1        true
    > 
    

    3. 验证变更策略之后,存储数据是否会变少

    默认的telegraf数据库的存储策略是一直保存数据,并无限制。那么为了节省数据存储,我下面创建一个保留1小时的策略,然后删除默认的策略,观察存储数据是否变少。

    3.1 变更策略之前的数据存储大小

    在变更策略之前,我特意运行了采集数据服务几天,查看目前的存储数据大小如下:

    [root@server influxdb]# du -h --max-depth=1 .
    69M ./data
    69M .
    [root@server influxdb]# 
    

    可以看到有69M的存储数据。

    3.2 创建新策略,删除旧策略

    # 创建新策略
    > CREATE RETENTION POLICY "rule_telegraf" ON telegraf DURATION 1h REPLICATION 1 DEFAULT;
    > 
    > show retention policies on telegraf
    name          duration shardGroupDuration replicaN default
    ----          -------- ------------------ -------- -------
    autogen       0s       168h0m0s           1        false
    rule_telegraf 1h0m0s   1h0m0s             1        true
    > 
    # 删除历史策略
    > drop retention POLICY "autogen" ON "telegraf";
    > 
    # 查看当前的数据策略
    > show retention policies on telegraf
    name          duration shardGroupDuration replicaN default
    ----          -------- ------------------ -------- -------
    rule_telegraf 1h0m0s   1h0m0s             1        true
    > 
    

    3.3 删除旧策略之后,确认数据存储大小

    # 删除旧策略之前,数据有69M
    [root@server influxdb]# du -h --max-depth=1 .
    69M ./data
    69M .
    [root@server influxdb]# 
    # 删除旧策略之后,数据只保留15M
    [root@server influxdb]# du -h --max-depth=1 .
    15M ./data
    15M .
    [root@server influxdb]# 
    

    从上面的结果来看,只需要配置管理数据保留策略,就可以控制好数据的存储空间。

    相关文章

      网友评论

        本文标题:9. InfluxDB 设置数据保留策略,验证保留的数据存储大小

        本文链接:https://www.haomeiwen.com/subject/prhjwctx.html