TIDB~常用监控指标

TIDB~常用监控指标

作者: 开心的蛋黄派 | 来源:发表于2024-07-05 15:52 被阅读0次

Zabbix监控TiDB(二)
看不懂监控怎么办？TiDB 新推出了耗时关系图
指标监控
Linux常用监控指标
mysql 常用监控指标
Zookeeper常用监控指标整理
如何高效利用 Grafana 监控分析 TiDB 指标
性能常用的监控指标
第10章 Kubernetes集群资源监控
监控笔记

TiDB-Server

响应时间统计
- SQL层次：Query Summary -> Duration（999, 99, 95, 80 百分位响应时间）
- Server层次：Query Details -> Duration（整体响应时间统计）
QPS统计
- SQL层次：Query Summary -> QPS（每秒查询次数）
- Server层次：Query Summary -> CPS BY INSTANCE（每秒调用次数，按实例统计）
事务统计
- 响应时间：Transcation -> Duration（事务处理时间，区分乐观事务和悲观事务）
- 语句量：Transcation -> Transcation Statement Num（事务中包含的语句数量，用于识别大事务）
基础指标
- 资源使用率：Server -> cpu/memory/connection count（CPU、内存和连接数使用率）
- SQL排队情况：Server -> Get token duration（获取处理令牌的等待时间）
TSO获取
- 延迟统计：pd-client -> pd-tso wait/rpc duration（获取TSO时间戳的延迟）
TiKV相关请求
- 响应时间：kv-request -> kv-request duration（TiKV请求的响应时间）
- 错误重试：kv-errors -> kv-backoff ops（TiKV请求错误后的重试次数）

TiKV

集群状态
- 存储使用率：tikv-details -> cluster（Store/Available，总/已使用/剩余可用存储）
- 基础资源：tikv-details -> cluster（cpu/memory/io/QPS/Mbps，基础资源监控）
- Region分布：tikv-details -> cluster（leader/region，Region和Leader的分布情况）
- 繁忙状态：tikv-details -> cluster（errors -> server is busy，TiKV繁忙状态）
线程池状态
- gRPC处理：tikv-details -> thread（grpc poll cpu，处理所有接收到的TiKV请求）
- 读请求处理：tikv-details -> thread（unified read pool cpu，处理读请求）
- 写请求处理：tikv-details -> thread（Scheduler Work cpu，处理写请求和事务日志）
- Raft日志处理：tikv-details -> thread（Raft store cpu，处理Raft日志）
- 数据持久化：tikv-details -> thread（Async apply cpu，数据持久化工作）
耗时统计
- gRPC消息处理：tikv-details -> duration（grpc -> 99% grpc message duration，TiKV总请求耗时）
- 事务处理耗时：tikv-details -> duration（scheduler-commit相关指标，事务处理耗时和锁等待时间）
- Raft处理耗时：tikv-details -> duration（Raft propose/io相关指标，Raft处理、日志写入和提交耗时）

PD

服务监控：dashboard（PD服务的整体监控情况）
Region状态：region health（Region的健康状态，如empty region）
负载均衡：statistic -> balance（Store的分布情况，关注TiKV扩缩容时的均衡性）
热点统计：statistic -> hot write/read regions（写/读热点Region的识别）

通过这样的优化和重组，监控指标的结构更加清晰，便于理解和分析。同时，也更容易在监控系统中进行配置和可视化展示。

相关文章

Zabbix监控TiDB(二)
如果要使用 Zabbix 监控使用 TiDB，需使用 HTTP agent ，主动调用 TiDB 监控接口获取监控...
看不懂监控怎么办？TiDB 新推出了耗时关系图
TiDB 使用 Prometheus 和 Grafana 提供了非常详细的监控指标。在遇到各种性能或稳定性问题时，...
指标监控
指标的特性指标监控的报警链路常用的指标项可用性流量 cpu 内存 checkpoint conne...
Linux常用监控指标
本文转自:http://book.open-falcon.org/zh/faq/linux-metrics.htm...
mysql 常用监控指标
mysql 常用监控指标 TPS/QPS mysql.tps (Per Second) 平均每秒SQL语句执行次数...
Zookeeper常用监控指标整理
几年前整理的Zookeeper监控的常用指标，希望没有过期
如何高效利用 Grafana 监控分析 TiDB 指标
作者介绍：李坤，PingCAP 互联网架构师，TUG Ambassador，前美团、去哪儿数据库专家。一、概述 ...
性能常用的监控指标
1、监控指标性能测试通常需要监控的指标包括： 1.服务器：Linux应用服务器。具体包括CPU、Memory、...
第10章 Kubernetes集群资源监控
一. Kubernetes监控指标与监控方案 1.Kubernetes监控指标 (1).集群监控 • 节点资源利用...
监控笔记
监控分类系统业务监控方法探针（probing）内省（introspection）监控指标指标设计方法...

网友评论

本文标题：TIDB~常用监控指标

本文链接：https://www.haomeiwen.com/subject/bbxecjtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|TIDB~常用监控指标|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！