美文网首页rua
Docker日志收集

Docker日志收集

作者: 猴子精h | 来源:发表于2017-12-01 15:21 被阅读3945次

引子

Docker的应用为我们带来便利的同时,日志集中化问题就越来越有必要性了。

Docker的日志处理

在收集之前,我们先来简单了解下docker日志处理的机制。当启动一个容器的时候,它其实是docker daemon的一个子进程,docker daemon可以拿到你容器里面进程的标准输出,拿到标准输出后,它会通过自身的一个LogDriver模块来处理,LogDriver支持的方式很多,可以写到本地的文件(默认方式),可以发送到syslog等,见下图:


01.png

目前,常见的收集方式有下面几种:

  • 应用程序自行处理

    这个好像并跟这次的主题没有多少关系,比如:使用log4j可以将日志发送到远端的日志中心;

  • Docker Logging Driver

    通过LogDriver将日志发送到不同的地方,目前官方支持的log driver类型如下:

    docker log driver.png
  • 旁路方式

    旁路模式.png
  1. 利用docker API获取日志的stream,并发送到不同的地方。logspout 就是这个方式的一个开源组件,另外,阿里云平台的日志收集agent fluentd-pilot也是采用这种方案。

  2. 通过挂载volume的方式将容器内的日志落地到宿主机,宿主机上通过日志采集agent采集,比较流行的agent有logstash, fluentd等。

最佳实践

在日志收集的过程中,需要特别考虑性能的问题。试想一下,当容器的流量比较大的时候,势必日志也会随着大量地产生,这时就会有个问题,日志收集agent必然会跟容器抢占宿主机的资源,为了避免这个问题,在收集选型的时候就需要注意:

  • 限制日志收集agent使用的资源,这很容易就想到了docker容器的方式运行agent,docker通过cgroup可以将一个容器的所使用的资源进行完美的限制;
  • docker logging driver的性能问题,实测下来json-file(默认方式,写文件到本地)效率是最高的,fluentd logging driver, syslog logging driver会严重影响容器的QPS,容器QPS受后端日志收集agent处理快慢的影响。

综上所属,最佳实践就是采用旁路模式来收集,并且使用容器方式来运行并限定使用的资源;最终采用了logspout+Fluentd的方案(架构图见下),采用的理由如下:

  • 通过挂载volume的方式,无法取得容器运行的一些元数据(container_id), 在我们的环境里,后续的日志处理会依赖这些元数据;

  • 不方便为日志流添加一些自定义的字段;

    docker log采集.png

logspout通过docker.sock监听本地容器的启动,通过docker API获取到这个新容器的日志流,并将这个日志流通过udp的协议发送给fluentd处理,fluentd处理完成后发送给后续的日志系统。

最后,受阿里云fluentd-pilot的影响,我将官方的logspout进行一些小的修改,请见

  1. 日志采集的必需先声明,需要采集的容器需要在启动时添加label

    docker run --label "xingren.log=true"
    
  2. 默认采集docker env中的MESOS_TASK_ID, 因为我们使用的marathon+mesos作为容器的平台,后续日志处理需要这个字段;

部署

下面个出个docker-compose.yml, 通过docker-compose up就可以运行了;

version: "2"
services:
  logspout:
    image: techwong/logspout
    restart: on-failure
    environment:
     # 这个是发送给fluentd的日志内容模版,JSON格式
     RAW_FORMAT: '{ "container_id" : "{{ .Container.ID }}", "labels": {{ toJSON .Container.Config.Labels }}, "timestamp": "{{ .Time.Format "2006-01-02T15:04:05Z07:00" }}", "source" : "{{ .Source }}", "log": {{ toJSON .Data }}, "MESOS_TASK_ID": {{ getMESOS_TASK_ID .Container.Config.Env }} }'
    volumes:
      - /var/run/docker.sock:/var/run/docker.sock
    ports:
     - "24222:80"
    command: raw://fluent:5160
    depends_on:
      - fluent
    cpu_quota: 30000   # 限制CPU资源
    restart: always

  fluent:
    image: fluent/fluentd:v0.12
    volumes:
      - ./fluent:/fluentd/etc
    ports:
      - "24221:24221"
    environment:
      LOGSPOUT: ignore
      FLUENTD_CONF: docker_log_collect.conf
    cpu_quota: 30000
    restart: always

fluent的简单配置:

<source>
  @type udp
  tag docker
  format json
  port 5160
</source>

<match docker>
  @type stdout
</match>

最后,可以通过查看fluent的log来查看格式化的容器日志;

参考

相关文章

  • ELK(四)

    第十五章: filebeat收集docker日志升职加薪版 第十六章: filebeat收集docker日志终极杀...

  • 03 hadoop 日志收集

    0 目标 收集系统 docker 137个服务日志中错误日志, 根据服务名,跟日期显示 1 flume 收集日志到...

  • Docker日志收集

    引子 Docker的应用为我们带来便利的同时,日志集中化问题就越来越有必要性了。 Docker的日志处理 在收集之...

  • Docker集群日志收集之EFK实践

    docker集群中日志收集采用EFK(elasticsearch、fluent、kibana)方案。 Elasti...

  • 使用logstash作为docker日志驱动收集日志

    前言 logstash是一个开源的日志统一处理数据收集器,属于ELK中的L,在日志收集领域应用广泛. docker...

  • 使用Fluentd收集Docker容器日志

    本文介绍使用Fluentd收集standalone容器日志的方法。 Docker提供了很多logging driv...

  • Docker容器日志收集

    日志是 IT 系统的重要组成部分,记录了系统在什么时候发生了什么事情。我们可以根据日志排查系统故障,也可以做统计分...

  • EFK收集docker日志

    环境准备 添加es文件夹及配置文件 es.yml 添加kibana文件夹及文件配置 kibana.yml 添加fi...

  • ELK收集docker日志

    1.安装docker 2.启动docke并拉取运行容器 3.用浏览器访问容器测试 访问成功 4.修改配置文件 5....

  • fluentd的各版本的学习和了解

    1. fluentd-pilot fluentd-pilot是阿里开源的docker日志收集工具,Github项目...

网友评论

    本文标题:Docker日志收集

    本文链接:https://www.haomeiwen.com/subject/iilwbxtx.html