zipkin,pinpoint和skywalking对比

作者: superlee01 | 来源:发表于2018-10-31 09:58 被阅读44次

zipkin,pinpoint和skywalking对比
2020-02-15 分布式链路追踪工具SkyWalking集成
链路追踪 SkyWalking
第二节链路监控
谁说Cat不能做链路跟踪的，给我站出来
链路追踪之SkyWalking
APM巅峰对决：skywalking P.K. Pinpoint
开源工具集合
调用链选型Zipkin，Pinpoint，SkyWalking，
Net和Java基于zipkin的全链路追踪

APM（Application Performance Management）理论模型

Dapper，大规模分布式系统的跟踪系统

zipkin

简介

Zipkin是一种分布式跟踪系统。它有助于收集解决微服务架构中的延迟问题所需的时序数据。它管理这些数据的收集和查找。Zipkin的设计基于Google Dapper论文。

zipkin架构

使用和配置

zipkin-collector项目和zipkin-ui项目
 Spring Cloud Sleuth是spring推出的分布式链路追踪工具，借鉴了 Dapper, Zipkin和HTrace.可以和spring-cloud项目完美契合。下面是zipkin-collector的pom依赖

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>
    <artifactId>zipkin-collector</artifactId>

    <name>zipkin-collector</name>

    <parent>
        <groupId>io.choerodon</groupId>
        <artifactId>choerodon-framework-parent</artifactId>
        <version>0.8.0.RELEASE</version>
    </parent>
    <properties>
        <choerodon.starters.version>0.6.3.RELEASE</choerodon.starters.version>
    </properties>
    <dependencies>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-actuator</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-eureka</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-sleuth-zipkin</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-sleuth-zipkin-stream</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-stream-kafka</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-stream-binder-kafka</artifactId>
        </dependency>

        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-aop</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.retry</groupId>
            <artifactId>spring-retry</artifactId>
        </dependency>

        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin</artifactId>
            <version>1.31.3</version>
        </dependency>
        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin-autoconfigure-storage-elasticsearch-http</artifactId>
            <version>1.31.3</version>
        </dependency>

        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-test</artifactId>
            <scope>test</scope>
        </dependency>

        <dependency>
            <groupId>io.choerodon</groupId>
            <artifactId>choerodon-starter-hitoa</artifactId>
            <version>${choerodon.starters.version}</version>
        </dependency>
    </dependencies>

    <build>
        <finalName>app</finalName>
    </build>
</project>

zipkin的通信方式支持http和message queue（kafka,rabbitMQ），但是http通信方式影响到主程序，所以这里采用kafka异步消息的方式通信。

image.png

使用elasticsearch存储客户端发送来的数据
接下来是配置zipkin-ui服务，pom依赖和配置如下

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <artifactId>zipkin-ui</artifactId>

    <parent>
        <groupId>io.choerodon</groupId>
        <artifactId>choerodon-framework-parent</artifactId>
        <version>0.7.0.RELEASE</version>
    </parent>

    <properties>
        <choerodon.starters.version>0.5.4.RELEASE</choerodon.starters.version>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-actuator</artifactId>
        </dependency>
        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin-autoconfigure-ui</artifactId>
        </dependency>

        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin</artifactId>
            <version>1.31.3</version>
        </dependency>

        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin-server</artifactId>
            <version>1.31.3</version>
        </dependency>

        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin-autoconfigure-storage-elasticsearch-http</artifactId>
            <version>1.31.3</version>
        </dependency>

        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-test</artifactId>
            <scope>test</scope>
        </dependency>
        <dependency>
            <groupId>io.choerodon</groupId>
            <artifactId>choerodon-starter-hitoa</artifactId>
            <version>${choerodon.starters.version}</version>
        </dependency>
    </dependencies>

    <build>
        <finalName>app</finalName>
    </build>

</project>

bootstrap.yml配置

客户端服务需要加入如下依赖

        <dependency><!--如果服务需要zipkin监控功能则需要此依赖-->
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-sleuth-stream</artifactId>
        </dependency>

然后客户端作如下配置，配置kafka以及采样率

客户端配置

启动服务后发请求，访问zipkin-ui(http:localhost:9030)的服务端口即可查看可视化调用链了

zipkin调用链

pinpoint

简介

Pinpoint是一个APM（应用程序性能管理）工具，适用于用Java / PHP编写的大型分布式系统。有如下特性：

一目了然地了解您的应用程序拓扑
实时监控您的应用程序
获得每个事务的代码级可见性
在不更改一行代码的情况下安装APM代理
对性能的影响最小（资源使用量增加约3％）
报警

pointpoint概述与技术细节以及中文翻译
中文翻译图片丢失，但在英文文档里面可以找到对应图片

本地搭建

本地使用docker部署pinpoint-docker，版本为1.8.0
执行如下命令一键搭建，镜像比较大

git clone https://github.com/naver/pinpoint-docker.git
cd pinpoint-docker
docker-compose pull && docker-compose up -d

docker-compose会启动如下服务

Pinpoint-Web Server（ui界面）
Pinpoint-Collector
Pinpoint-Agent(ready to be used)
Pinpoint-Flink
Pinpoint-Zookeeper
Pinpoint-Hbase
Pinpoint-QuickStart(a sample application)

pinpoint架构

配置应用代理

下载release-1.8.0的pinpoint-agent包并解压
在JVM启动脚本增加下列三行代码

-javaagent:$AGENT_PATH/pinpoint-bootstrap-$VERSION.jar #绝对路径
-Dpinpoint.agentId=test #必须在pinpoinit安装的全部服务器集群中全局唯一. 最简单的让它保持唯一的方法是使用hostname($HOSTNAME)，因为hostname一般不会重复. 如果需要在服务器集群中运行多个JVM，请在hostname前面增加一个前缀来避免重复
-Dpinpoint.applicationName=api-gateway#服务名称，在ui界面显示

pinpoint代理原理图

代理会在应用程序启动前，用字节码增强技术注入Interceptor，然后代理使用UDP/TCP+Thrift发送数据到collector，collector负责持久化和处理数据，然后web ui从HBase中拿到数据进行展示

采样率

在pinpoint-agent-1.8.0/pinpoint.config配置采样率

#采样率为数字的倒数，1即1/1=100%，2表示1/2=50%
profiler.sampling.rate=1

使用

ui界面访问http://localhost:8079
pinpoint的功能还是很强大的，可以监控Jvm内存使用情况，Jvm永久带使用占用空间，Cpu使用情况，每秒处理的消息数（S标识操作系统，U标识此应用），Jvm线程情况，单请求平均响应时间等，颗粒度很细，缺点是环境搭建比较繁琐，高并发情况下，代理对吞吐量的影响比skywalking和zipkin都大，后续会介绍性能的对比

调用链明细

应用检查器

主界面

skywalking

简介

SkyWalking是一个开源的APM系统，包括监控，跟踪，诊断Cloud Native架构中分布式系统的功能。
核心功能如下。

服务，服务实例，端点指标分析
根本原因分析
服务拓扑图分析
服务，服务实例和端点依赖性分析
慢服务和端点检测
性能优化
分布式跟踪和上下文传播
报警

SkyWalking支持从多个来源和多种格式收集遥测（痕迹和指标）数据，包括
1.SkyWalking格式的Java，.NET Core和NodeJS自动仪器代理
2.Istio遥测格式
3.Zipkin v1 / v2格式

skywalking架构

5.x版本文档

部署

5.0.0-GA版本只能和5.x版本的elasticsearch匹配，使用6.x版本会连不上elasticsearch
run bin/startup.sh即可启动
需要配置好服务器的时区和时间

配置agent

1.拷贝agent目录到所需位置. 日志，插件和配置都包含在包中,请不要改变目录结构.
2.增加JVM启动参数， -javaagent:/path/to/skywalking-agent/skywalking-agent.jar. 参数值为skywalking-agent.jar的绝对路径。
3.支持插件，插件全部放置在 /plugins 目录中.新的插件,也只需要在启动阶段,放在目录中,就自动生效,删除则失效.
4.可以在/agent/config/agent.conf 配置每个应用的agent.application_code，也可以通过vm参数来覆盖代理配置-javaagent:/path/to/skywalking-agent/skywalking-agent.jar -Dskywalking.agent.application_code=gateway-helper

配置成功后，ui界面访问：http://localhost:8080，使用admin/admin登陆

集群部署

https://github.com/apache/incubator-skywalking/blob/5.x/docs/cn/Deploy-backend-in-cluster-mode-CN.md

性能

探针性能

UI界面

dashboard

应用拓扑图

VM指标

服务指标

调用链

采样率

在/agent/config/agent.config文件里配置，skywalking默认的采样率是100%

# 每3秒取样的次数，负数的含义是尽可能多的取样，即100%取样
agent.sample_n_per_3_secs=-1

zipkin,pinpoint和skywalking的比较

性能（摘自https://juejin.im/post/5a7a9e0af265da4e914b46f1）

选用了一个常见的基于Spring的应用程序，他包含Spring Boot, Spring MVC，redis客户端，mysql。监控这个应用程序，每个trace，探针会抓取5个span(1 Tomcat, 1 SpringMVC, 2 Jedis, 1 Mysql)。这边基本和 skywalkingtest 的测试应用差不多。

模拟了三种并发用户：500，750，1000。使用jmeter测试，每个线程发送30个请求，设置思考时间为10ms。使用的采样率为1，即100%，这边与生产可能有差别。pinpoint默认的采样率为20，即50%，通过设置agent的配置文件改为100%。zipkin默认也是1。组合起来，一共有12种。下面看下汇总表：

性能对比图

从上表可以看出，在三种链路监控组件中，skywalking的探针对吞吐量的影响最小，zipkin的吞吐量居中。pinpoint的探针对吞吐量的影响较为明显，在500并发用户时，测试服务的吞吐量从1385降低到774，影响很大。然后再看下CPU和memory的影响，在内部服务器进行的压测，对CPU和memory的影响都差不多在10%之内。

collector的可扩展性、全面的调用链路数据分析、对于开发透明，容易开关等

参阅这篇文章

zipkin,pinpoint和skywalking对比
APM（Application Performance Management）理论模型 Dapper，大规模分布式...
2020-02-15 分布式链路追踪工具SkyWalking集成
前言目前主要的一些 APM 工具有: Cat、Zipkin、Pinpoint、SkyWalking；Apache...
链路追踪 SkyWalking
什么是 SkyWalking 目前主要的一些 APM 工具有: Cat、Zipkin、Pinpoint、SkyWa...
第二节链路监控
链路监控主要有：cat， zipkin， pinpoint , skywalking 4个开源组件 1、Zipki...
谁说Cat不能做链路跟踪的，给我站出来
背景链路跟踪，我们有很多可选项。常见的有 zipkin，pinpoint，skywalking，jaeger 等...
链路追踪之SkyWalking
1.什么是 SkyWalking 目前主要的一些 APM 工具有: Cat、Zipkin、Pinpoint、Sky...
APM巅峰对决：skywalking P.K. Pinpoint
说明：本次对比基于skywalking-6.0.0-GA和Pinpoint-1.8.2（截止2019-02-19最...
开源工具集合
应用性能监控(APM) skywalking项目 skywalking首页zipkin项目 zipkin首页 ...
调用链选型Zipkin，Pinpoint，SkyWalking，
简介 Zipkin是Twitter开源的调用链分析工具，目前基于springcloud sleuth得到了广泛的使...
Net和Java基于zipkin的全链路追踪
在各大厂分布式链路跟踪系统架构对比中已经介绍了几大框架的对比，如果想用免费的可以用zipkin和pinpoint还...