美文网首页DevOPS程序员技术干货
aws 日志收集分析测试

aws 日志收集分析测试

作者: modeyangg_cs | 来源:发表于2016-04-05 15:11 被阅读955次

将日志收集到aws的S3存储,通过aws ES实时分析日志、Spark离线日志分析,支持无线扩容。

一、日志收集

利用logstash output直接到S3存储, 在aws建立好bucket,配置好logstash config文件将日志打入到bucket即可。具体配置见logstash output S3
实例:

output {
s3 {       
access_key_id => "AKIAJEVY5ZME3Q"        
secret_access_key => "QtQiyCZVi06xl9n/2JYfJ1YL+mPWf9"
region => "ap-southeast-1"
bucket => "ott-log-storage"       
time_file => 5     
codec => "json_lines"  
}
}

上述会将日志切成5分钟一段。在aws控制台相应的S3 bucket里面就会看到日志信息。

二、实时分析日志

在aws 服务列表找到 ElasticSearch Service, 按照步骤创建ES实例,十分钟后,创建完成,会有对应的EndPoint信息和Kibana地址。
选择一台机器,最好是EC2, 按照logstash, 将相应S3 bucket 日志文件push到ES中,在Kibana地址配置好index通配字符串后,就可以看到该业务的日志列表。

input
{   
s3 {        
bucket => "ott-log-storage"        
access_key_id => "AKIAJEWJVZY5ZME3Q"        
secret_access_key => "QtQiyCZViPR06xl9n/2JYfJsarxY1YL+mPWf9"   region => "ap-southeast-1"    
}
}
 

filter
 {
json {        
source => "message"        
remove_field => ["hour", "day"]    
}
}

output{
elasticsearch {
hosts 
=> ["search-modeyangg-r6qoi2q3bwgmq.apsoutheast-1.es.amazonaws.com:443"]
ssl => true      
flush_size => 1000      
index => "%{type}_access-%{+YYYY.MM.dd}"       
idle_flush_time => 10    
}

}

上面是logstash config文件

三、离线分析日志

在aws上创建spark的EMR服务,创建成功后,利用SSH登陆Master机器,运行pyspark, 即可测试spark集群。
spark支持从S3读取数据,利用EMRFS可供hadoop/spark集群使用, 利用Spark SQL就可像sql一样统计日志数据。

from pyspark.sql 
import SQLContext

sqlContext =SQLContext(sc)

df = sqlContext.read.json("s3n://<bucket>/<path>")

df.registerTempTable("ott_log_db")

ott_sql =sqlContext.sql(
"select sitegroup, count(sitegroup) as site_counts from ott_log_db group by sitegroup"
)

ott_sql.show()

具体用法参见Spark SQL

相关文章

  • aws 日志收集分析测试

    将日志收集到aws的S3存储,通过aws ES实时分析日志、Spark离线日志分析,支持无线扩容。 一、日志收集 ...

  • 【iOS】腾讯Bugly使用记录

    由于项目中以前没有收集崩溃日志,对崩溃问题都是测试发给我们崩溃日志,然后我们自己去进行符号化,再进行分析,这样的话...

  • AWS综合测试

    AWS 综合测试分析 D. Auto Scaling may cause you to reach limits ...

  • 27. 性能测试总体流程

    总体流程 收集需求 开发测试脚本 执行测试 分析及报告 性能优化 执行测试 分析及报告 重复以上步骤... 收集需...

  • Hive分析AWS ELB访问日志

    保存 AWS ELB 访问日志 AWS ELB - AWS elastic load balancing,为了方便...

  • 关于GC日志查看分析指南

    截至JDK1.8 的一些垃圾收集器日志查看指南 CMS日志分析 G1日志分析

  • 2018-05-04 Monkey 日志分析

    Monkey 日志分析是 Monkey 测试中非常重要的一个环节,通过日志分析,可以获取当前测试对象在测试过程中是...

  • Docker + AWS CloudWatch 收集容器日志

    目标 将容器日志吐到 AWS CloudWatch 里 创建生成 CloudWatch 访问权限 创建一个包含日志...

  • AWS 使用 CloudWatch Logs 收集日志

    很多时候,我们希望集中收集各服务器日志统一查看、报警。AWS 给我们提供了这种服务,叫 CloudWatch Lo...

  • GC 日志分析工具列表

    gc日志分析工具 性能测试排查定位问题,分析调优过程中,会遇到要分析gc日志,人肉分析gc日志有时比较困难,相关图...

网友评论

  • 隔壁二狗子:你好,请问下从s3上面取下来日志,比实际日志少了很多,是什么情况呢,70日志都没有取到
    隔壁二狗子:@modeyangg_cs 处理,回来报个到,升级到5.5.x 就没问题了 5.0.0 的bug
    modeyangg_cs:这个我倒是没有发现

本文标题:aws 日志收集分析测试

本文链接:https://www.haomeiwen.com/subject/vgyplttx.html