
报错时快速定位问题、监控到服务的运行状态、业务指标精准营销
--分布式日志引擎
1.业务服务化带来的问题
1)出现错误难定位问题
传统日志方式对比时间长、效率低下
针对分布式服务调用链跟踪平台——“鹰眼”
核心实现思路类比:高速路网络和汽车
2.鹰眼平台的架构

3.埋点和输出日志
4.海量日志分布式处理平台
海量日志分布式处理平台TLog:只需完成三步操作配置:日志采集设置、日志数据处理流程自定 义、API方式数据获取,就能通过分布式日志处理的方式实现所需要监控的技术或业务指标信息。

5.日志收集控制
在遇到大 量请求时只记录其中一部分数据,而不是像平时那样做全量的数据记录。
在实际的使用中,结合服务调用的频率和业务的访问量,调整适合的日志采样率,找到事件捕捉和性能损耗的平衡点,也是此类跟踪平台需要考虑的问题。
6.典型业务场景
1.服务实时监控
2.服务调用链跟踪
除了对于系统出现问题时,起到快速定位问题的作用,也对应用的性能优化带来帮助。
即是对服务运行状态和调用关系进行实时呈现
应用服务化工作 +服务管控能力
3.服务调用链分析
服务间的依赖关系以及服务运行的持续稳定和优化。
4.业务全息排查
若有了调用链对应操作的业务信息,对于系统异常的定位会更加精准和快捷。
全息排查系统,本质上是将服务链路信息与业务事件进行了集成,将业务事件通过服务调用链的traceID&rcpID进行双向关联。
5.业务实时监控
有些数据在产生后的一段时间内如果不 利用好,就会随着时间的推移其业务价值陡降。

发掘数据的最高时效价值,帮助业务寻求潜在的增长点:
传统方案:
一:直接访问在线交易数据库
(在线数据库压力大,性能受影响)
二:将业务数据从在线交易数据库通过ETL的方式同步到数据仓库或其他的数据库中
(数据同步时间,数据更新量大在线数据库压力)
优化方案:利用分布式日志处理平台TLog的能力,业务事件日志输出---》采集---》下发解析处理
网友评论