美文网首页
2019-05-29 ES存储数据量优化

2019-05-29 ES存储数据量优化

作者: 四火流年 | 来源:发表于2019-05-30 15:02 被阅读0次

386个标准csv文件,9列,912M,6839927行,

如果是默认index的配置进入es,即5个shards,1个replica,那么占用 3.2G的空间。

那么,通过下面的方式,设置0个replica,1个shard

PUT _template/<template_name>
{
  "index_patterns": "*",
  "settings" : {
    "number_of_replicas" : 0,
    "number_of_shards" : 1
  },
  "version"  : 1
}

然后,再在 grok 解析那里,把原始的message舍去(如果不需要全文索引的话)。那么最后占用空间是1.6G。在kibana上 GET _cat/indices?v 展示的是 1gb
在导入的过程中可以发现,这个占用空间会增长到 2.3G 甚至更多。然后回落、再涨、再回落。
这里是有一个数据压缩的过程,下次再仔细介绍。

大约8分30秒,这684w的数据进入es。平均速度是 13411 TPS。
使用的是一个虚拟机,16G 内存,600G SATA,4核,Intel(R) Xeon(R) CPU E5-2650 v4 @ 2.20GHz。给ES开的内存是

-Xms1g
-Xmx1g

曾经一个正儿八经的3实体机集群,SATA盘,从kafka接数据,可以达到25w TPS。

相关文章

  • 2019-05-29 ES存储数据量优化

    386个标准csv文件,9列,912M,6839927行, 如果是默认index的配置进入es,即5个shards...

  • Es原理分析

    Es数据存储模型 Es读写模型 感谢:《Elasticsearch源码解析与优化实战》-张超

  • ES 常见面试问题

    ES 在数据量很大的情况下(数十亿级别)如何提高查询效率 es 性能优化是没有什么银弹的,啥意思呢?就是不要期待着...

  • 记一次ES查询结果集失败

    使用es存储查询时有分页功能,数据量较少时并没有发现该问题。但是当数据量比较大时,要查询第101页的数据,每页数据...

  • Impala性能优化总结

    Impala性能优化要点: 1. 为数据存储选择合适的文件格式(如:Parquet)   通常对于大数据量来说,P...

  • ES大数据量下的查询优化

    在数据规模很大(比如万恶的trace日志)的时候我们有时候会发现第一次访问查询特别慢,可能有几秒钟的样子,然后后面...

  • ELK性能优化实战总结:我强任我强,你“跪”标准好好学

    一、背景介绍 近一年内对公司的 ELK 日志系统做过性能优化,也对 SkyWalking 使用的 ES 存储进行过...

  • ELK 性能优化实践

    一、背景介绍 近一年内对公司的 ELK 日志系统做过性能优化,也对 SkyWalking 使用的 ES 存储进行过...

  • ElasticSearch性能优化实践

    一、背景介绍 近一年内对公司的 ELK 日志系统做过性能优化,也对 SkyWalking 使用的 ES 存储进行过...

  • 8.MySQL优化

    调优思路 1.硬件优化2.数据库设计与规划———以后在修改很麻烦,估计数据量,使用什么存储引擎3.数据的应用———...

网友评论

      本文标题:2019-05-29 ES存储数据量优化

      本文链接:https://www.haomeiwen.com/subject/dzdytctx.html