美文网首页
prometheus+grafana搭建监控系统

prometheus+grafana搭建监控系统

作者: cnwinds | 来源:发表于2020-03-11 14:36 被阅读0次

    prometheus是一套系统和服务监控系统。它以给定的时间间隔从已配置的目标收集指标,评估规则表达式,显示结果,并在发现某些情况为真时触发警报。[prometheus官网]
    grafana 是一款采用 go 语言编写的开源应用,主要用于大规模指标数据的可视化展现,是网络架构和应用分析中最流行的时序数据展示工具。[grafana官网]

    下面我们将使用prometheus强大的数据采集分析功能,grafana优秀的前端展示能力,搭建一套监控系统。

    准备工作

    在每台机器上都需要先安装并启动docker。

    1. 安装docker
    yum install docker
    
    1. 启动docker
    service docker start
    

    安装prometheus

    1. 安装采集器

    采集器有多种类型,比如采集系统数据,采集nginx数据,采集mysql数据等等。可以根据需要在目标主机上安装需要的采集器。可以根据自己的需要安装一个或多个。

    安装linux指标采集器

    docker run -d -p 9100:9100 -v "/proc:/host/proc:ro" -v "/sys:/host/sys:ro" -v "/:/rootfs:ro" prom/node-exporter
    

    安装nginx指标采集器

    docker run -d -p 9113:9113 --net="host" nginx/nginx-prometheus-exporter -nginx.scrape-uri http://localhost:8080/nginx_status
    

    注意:nginx.scrape-uri后面的地址,可以通过curl 访问并返回指标数据。
    如果不能正常访问则需要在nginx.conf配置文件中增加以下一段内容。

    server {
        listen 8080
        location = /nginx_status {
            stub_status on;
                    allow 127.0.0.1;
                    deny all;
        }
    }
    

    安装cadvisor指标采集器
    cadvisor可以监控docker容器的各种指标。

    docker run   --volume=/:/rootfs:ro   --volume=/var/run:/var/run:ro   --volume=/sys:/sys:ro   --volume=/var/lib/docker/:/var/lib/docker:ro   --volume=/dev/disk/:/dev/disk:ro   --publish=8090:8080   --detach=true   --name=cadvisor   google/cadvisor
    

    如果出现重名错误则执行以下语句后重新启动docker。

    docker rm $(docker ps -a -q)
    

    可能有些机器上会出现/sys/fs/cgroup/cpuacct,cpu: no such file or directory报错,执行以下语句后,重新启动docker。

    ln -s /sys/fs/cgroup/cpu,cpuacct /sys/fs/cgroup/cpuacct,cpu
    

    然后在prometheus.yml文件中进行相应配置即可。

    使用docker-compose安装采集器

    version: "2"
    services:
      node_export:
        image: prom/node-exporter
        ports:
        - 8091:9100
        volumes:
        - /:/rootfs:ro
    
      cadvisor:
        image: google/cadvisor
        ports:
        - 8090:8080
        volumes:
        - /:/rootfs:ro
        - /var/run:/var/run:ro
        - /sys:/sys:ro
        - /var/lib/docker/:/var/lib/docker:ro
    

    使用以下命令启动

    docker-compose -f monitor-metrics.yaml up -d
    

    2. 安装prometheus

    创建prometheus配置文件。

    mkdir /opt/prometheus
    cd /opt/prometheus/
    vi /opt/prometheus/prometheus.yml
    

    文件内容如下,需要根据自己的实际情况进行修改

    # Prometheus全局配置项
    global:
      scrape_interval:     15s # 设定抓取数据的周期,默认为1min
      evaluation_interval: 15s # 设定更新rules文件的周期,默认为1min
      scrape_timeout: 15s # 设定抓取数据的超时时间,默认为10s
      external_labels: # 额外的属性,会添加到拉取得数据并存到数据库中
        monitor: 'codelab_monitor'
    
    
    # Alertmanager配置
    alerting:
      alertmanagers:
      - static_configs:
        - targets: ["localhost:9093"] # 设定alertmanager和prometheus交互的接口,即alertmanager监听的ip地址和端口
         
    # rule配置,首次读取默认加载,之后根据evaluation_interval设定的周期加载
    rule_files:
      - "alertmanager_rules.yml"
      - "prometheus_rules.yml"
    
    # scape配置
    scrape_configs:
    - job_name: 'prometheus' # job_name默认写入timeseries的labels中,可以用于查询使用
      scrape_interval: 15s # 抓取周期,默认采用global配置
      static_configs: # 静态配置
      - targets: ['localhost:9100'] # prometheus所要抓取数据的地址,即instance实例项
    
    - job_name: 'example-random' #个人测试用接口
      static_configs:
      - targets: ['localhost:8080']
    

    主要是 scrape_configs 的配置,根据每一台要监控的机器,添加一组描述,targets里面填写采集器的ip和端口。job_name每个都不能相同。

    这是一个配置的例子

    global:
      scrape_interval:     60s
      evaluation_interval: 60s
     
    scrape_configs:
      - job_name: prometheus
        static_configs:
          - targets: ['localhost:9090']
            labels:
              instance: prometheus
     
      - job_name: linux2
        static_configs:
          - targets: ['123.45.2.34:9100']
            labels:
              instance: order
              
      - job_name: linux3
        static_configs:
          - targets: ['123.45.2.39:9113']
            labels:
              instance: login
    

    启动prometheus

    docker run -d -p 9090:9090 --net=host -v /opt/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml prom/prometheus
    

    安装grafana

    准备本地保存数据的目录。

    mkdir /opt/grafana-storage
    chmod 777 -R /opt/grafana-storage
    

    启动grafana

    docker run -d -p 3000:3000 --name=grafana --net=host -v /opt/grafana-storage:/var/lib/grafana grafana/grafana
    

    接下来打开 http://localhost:3000
    输入用户名 admin 密码 admin

    配置prometheus数据源后,可以开始使用了。

    使用docker-compose安装

    准备本地保存数据的目录。

    mkdir /opt/grafana-storage
    chmod 777 -R /opt/grafana-storage
    mkdir /opt/prometheus/storage
    chmod 777 -R /opt/prometheus/storage
    

    准备promethues.yaml文件

    version: '2'
    services:
      prometheus:
        image: prom/prometheus
        ports:
        - '9090:9090'
        volumes:
        - /opt/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml
        - /opt/prometheus/storage:/prometheus
        - /usr/share/zoneinfo/Asia/Shanghai:/etc/localtime
        network_mode: "host"
    
      grafana:
        image: grafana/grafana
        ports:
        - '3000:3000'
        volumes:
        - /opt/grafana-storage:/var/lib/grafana
        - /usr/share/zoneinfo/Asia/Shanghai:/etc/localtime
        network_mode: "host"
    

    启动prometheus

    docker-compose -f promethues.yaml up -d
    

    参考资料

    https://prometheus.io/docs/prometheus/latest/querying/basics/
    https://grafana.com/grafana/dashboards
    https://www.cnblogs.com/Leslieblog/p/11157958.html
    https://www.cnblogs.com/xiao987334176/p/9930517.html
    Grafana 的一些使用技巧

    相关文章

      网友评论

          本文标题:prometheus+grafana搭建监控系统

          本文链接:https://www.haomeiwen.com/subject/gvsodhtx.html