美文网首页
今日份打卡 167/365

今日份打卡 167/365

作者: 打卡机器人 | 来源:发表于2019-06-18 09:41 被阅读0次
    • 技术文章

      • [Elasticsearch如何做到亿级数据查询毫秒返回] (https://mp.weixin.qq.com/s/8ibE2JvlqAc6Ee-RNvkkCA)
      • ES性能没有想象中的好。特别在面对几亿条数据的时候,可能跑个搜索5~10s。
      • 针对海量数据的查询优化,没有银弹。就是不要期待着随手调一个参数,就可以万能的应对所有的性能慢的场景。
      • 优化核心:filesystem cache
        • es 的搜索引擎严重依赖于底层的 filesystem cache
      1. 提高cache:机器的内存,至少可以容纳你的总数据量的一半
      2. 控制索引量:仅仅在 es 中就存少量的数据,就是你要用来搜索的那些索引。其他的字段数据存在 mysql/hbase 里。
      3. 数据预热:自己的后台系统去搜索一下热数据,刷到 filesystem cache 里去
      4. 冷热分离:确保热数据在被预热之后,尽量都让他们留在 filesystem os cache 里,别让冷数据给冲刷掉。
      5. document 模型设计:es 里面的复杂的关联查询尽量别用,一旦用了性能一般都不太好。最好是先在 Java 系统里就完成关联,将关联好的数据直接写入 es 中。
      6. 减少甚至避免翻页:因为es 的分页是较坑的,在分布式情况下,你要查第 100 页的 10 条数据,不可能说从 5 个 shard,每个 shard 就查 2 条数据。
        1. 不允许深度分页(默认深度分页性能很差)
        2. 不断下拉出来一页一页
        3. 不能随意跳到任何一页的场景

    相关文章

      网友评论

          本文标题:今日份打卡 167/365

          本文链接:https://www.haomeiwen.com/subject/fidxqctx.html