美文网首页
Canal系列~故障运维汇总

Canal系列~故障运维汇总

作者: 开心的蛋黄派 | 来源:发表于2024-01-30 23:30 被阅读0次

    一 Canal异常重启引发OOM与高CPU占用

    原因分析: 主要原因是处理的表数量庞大,这在多用户同时使用的测试环境中尤为突出。
    解决方案:
    增强JVM内存分配: 通过设置如“-Xmx10240m”的参数,为Canal提供更多的内存资源。
    版本升级: 升级到Canal的更新版本,从而获得可能的性能提升和缺陷修复。
    硬件提升: 升级服务器硬件,以满足更高的处理和存储需求。

    二 Canal延迟增加的多种情形及处理建议
    1、大消息报错: 当Canal服务端已配置足够大的消息体,但Kafka的topic消息体大小不足时,需要相应调整Kafka的配置以扩容。
    2、缺失的元数据表: 如出现“tsdb_meta_table 不存在”的错误,需要用户在后端MySQL数据库中手动创建该表。
    3、网络通信问题: 若存在与ZooKeeper或Kafka的通信故障,应检查并开放相应的网络安全组设置。
    4、大量的上游MySQL binlog生成
    处理方式:
    1、等待策略: 在某些情况下,最简单的解决方案是等待Canal自然追赶。
    2、黑名单过滤: 在Canal消费实例端设置黑名单,以过滤掉生成大量数据的大表。
    3、版本升级推荐: 升级到Canal 1.1.6版本,此版本在内存消耗和消息处理能力上有所优化。
    4、优化解析格式: 在相同的binlog生成量下,使用protobuf解析格式通常比json模式更高效。
    补充说明
    1、通过监控模版监控Canal延时,建议将阈值设置为30s,15s之内的Canal消费延时属于正常范围

    相关文章

      网友评论

          本文标题:Canal系列~故障运维汇总

          本文链接:https://www.haomeiwen.com/subject/xixpodtx.html