Zipkin与Elasticsearch最佳实践

作者: ilkkzm | 来源:发表于2018-01-18 10:58 被阅读5276次

Zipkin与Elasticsearch最佳实践
Elasticsearch最佳实践之分片使用优化
zipkin 与 elasticsearch
Elasticsearch集成Hadoop最佳实践.pdf 免费
Elasticsearch 最佳实践！
spring boot 2.0 版本的 zipkin 链路追踪整
spring boot 1.5.12 版本的 zipkin 链路
Elasticsearch性能优化最佳实践
ElasticSearch | 数据建模 | 最佳实践
ElasticSearch 5.X 最佳实践

ZipKin与Elasticsearch的最佳实践
ZipKin是什么
zipkin是Twitter基于google的分布式监控系统Dapper（论文）的开发源实现，zipkin用于跟踪分布式服务之间的应用数据链路，分析处理延时，帮助我们改进系统的性能和定位故障。
Dapper论文地址
ElasticSearch是什么
Elasticsearch 是一个分布式的 RESTful 风格的搜索和数据分析引擎，能够解决不断涌现出的各种用例。作为 Elastic Stack 的核心，它集中存储您的数据，帮助您发现意料之中以及意料之外的情况。
Dapper
两点需求
无所不在的部署，持续的监控
三个具体设计目标
 低消耗
跟踪系统对在线服务的影响应该做到足够小
 应用级透明
对于应用的程序员来说，是不需要知道有跟踪系统这回事的
 延展性
在未来几年的服务和集群的规模，监控系统都应该能完全把控住
一个额外的设计目标是为跟踪数据产生之后，进行分析的速度要快，理想情况是数据存入跟踪仓库后一分钟内就能统计出来。
ZipKin详解
应用背景
大型互联网公司为什么需要分布式跟踪系统？为了支撑日益增长的庞大业务量，我们会把服务进行整合、拆分，使我们的服务不仅能通过集群部署抵挡流量的冲击，又能根据业务在其上进行灵活的扩展。一次请求少则经过三四次服务调用完成，多则跨越几十个甚至是上百个服务点。如何动态展示服务的链路？如何分析服务链路的瓶颈并对其进行调优？如何快速进行服务链路的故障发现？这就是服务跟踪系统存在的目的和意义。
设计要点
 对应用透明、低侵入
 低开销、高稳定
 可扩展
对于服务降级系统、分布式跟踪系统和业务监控系统等，这三点都是必须的
系统设计图
系统数据流主要分为三个步骤：采集、发送和落盘分析
‘’
内部数据模型

示例
以下为一个示例：用户请求 /foo ，当响应完成后，结果放在同一个span里面异步发送到zipkin

详解Span
一条完整的服务链路由Span组成
Span一般包含以下字段
 traceId: 全局跟踪id,用于标识属于同一服务链路
 id: span的id,再traceId下唯一即可
 parentId: 同一条连路上，有span有层级关系，类似xml, parentId用于标识父节点Span id
 name: span的名称
 timestamp: span创建的时间，用于体现采集的时间戳
 duration: span的创建到采集结束所消耗的时间，即跟踪埋点服务调用的总耗时
 annations: 基本标注列表，理解为span生命周期内重要时刻的快照，一般包含发生时刻（timestamp）、事件类型（value）、端点（endpoint）等信息
示例如下：

事件类型分类：
cs (客户端/消费者发起请求) customer send
cr (客户端/消费者接到应答) customer received
sr (服务端/生产者接收到请求) service received
ss (服务端/生产者发送应答) service send
 binaryAnnotations
业务标注列表，如果某些跟踪埋点需要带上部分业务数据（比如url地址、返回码和异常信息等），可以将需要的数据以键值对的形式放入到这个字段中
传输库
Span由服务到Zipkin的收集器的传输库主要有3个：HTTP Kafka 和 Scribe
组成结构
主要有4部分组成
 收集器
 存储库
 搜索引擎
 UI界面
存储库
Zipkin内置的存储库为 Cassandra 。该库在twitter广泛使用。
此处为插件化，在Cassandra基础上，推荐使用Elasticsearch和mysql。
搜索引擎
内部数据带有索引形式存储，搜索引擎提供了json api用于查找、分析tracer. WebUI是主要使用方。
WebUI
webUI用于更加具体形象的查询分析tracer.方便了zipkin的使用。该webUI内部是没有身份验证机制的。
权限访问

ZipKin的安装
安装
最快的方式是获取最新的可执行jar包,下载地址如下：
https://search.maven.org/remote_content?g=io.zipkin.java&a=zipkin-server&v=LATEST&c=exec
或者Linux上执行如下命令：
curl -sSL https://zipkin.io/quickstart.sh | bash -s
java -jar zipkin.jar
注意点
Zipkin需要在 jre8 + 上执行
以上运行基于内存数据库，重启后数据消失，后面介绍将storage采用elasticsearch进行存储
集成库
针对java，封装了Brave 进行使用
权限访问UI
Zipkin登录认证
可以通过nginx请求转发增加认证
Centos环境：
安装nginx
yum install nginx
安装 htpasswd 命令
yum install httpd
生成账号密码:
htpasswd -c /data/nginx/db/passwd.db elkadmin
-c 后面是生成的账号密码信息储存文件
Nginx配置如下：

访问效果

登录

Elasticsearch的安装
安装
进入Elasticsearch官网(https://www.elastic.co/products/elasticsearch) ,点击右上角Download下载最新版
解压进入bin目录，./elasticsearch 进行front启动。
需要后台运行的话，执行： nohup ./elasticsearch >/dev/null 2>&1 &
Elasticsearch启动注意事项
Elasticsearch注意事项比较多。参考Elasticsearch注意事项文档

Zipkin与 Elasticsearch 结合启动
Linux上创建脚本

!/bin/bash

QUERY_PORT=20510 STORAGE_TYPE=elasticsearch ES_HOSTS=http://172.17.20.231:9200 java -jar zipkin.jar
QUEYR_PORT 指定启动的端口
STORAGE_TYPE 制定存储类型
ES_HOSTS 指向elasticsearch服务