ElasticSearch使用总结（一）

作者: steinliber | 来源:发表于2016-08-12 10:04 被阅读524次

ElasticSearch使用总结（一）
Elasticsearch Aggregations使用总结
ElasticSearch使用总结（二）
ElasticSearch使用总结（三）
ElasticSearch 总结
2018-07-12（Elasticsearch）
19.es查询和写入原理解析
ElasticSearch 入门总结
ElasticSearch
实战：php（Yii2为例）中使用Elasticsearch作为

最近刚忙活完现有项目和elasticsearch的集成，其中踩了很多坑也学到了很多，现在工作告一段落了，就总结下自己在项目过程中的所学所得。

elasticsearch简单介绍

elasticsearch是一个分布式的全文检索引擎，所谓分布式指的是elasticsearch可以很方便的水平扩容，当你觉得一个elasticsearch节点满足不了你的需求时，可以直接将新的elasticsearch节点加入这个集群来提供更高效的服务。而全文检索指的就你查找一个词，所有与这个词相关的文章都会按照相关性顺序返回。

elasticsearch 全文检索的实现原理

传统的数据库如果想找到数据里面包含特定值的那些记录，基本上就要遍历所有相关的记录进行比较，当数据量不是很大时，对性能影响不是很大，但当数据量达到千万级甚至亿万级时，这样遍历不仅耗时间，而且会消耗大量系统资源。而且这样也找不到含近义词的数据，更别说按相关度排序了。那elasticsearch是如何解决这个问题的呢?
没错，就是倒排索引，既然从文章中找词效果不是很理想，那我们可以倒着来-->根据词来找到文章，这样一切就迎刃而解了。当我们把一篇文章保存在elasticsearch中时，它会先把这篇文章分解成一个个的词*（通过分词器，用户可自行选择），然后创建并维护这些词到文章的映射关系，当在elasticsearch中进行查询时也是一样，它会把查询的词分成每个独立的词，在维护的映射关系中查找得到对应的文章返回。
比如说我现在在elasticsearch中保存了下面的一句话，该纪录的id是123（好吧，我是有点小文艺的;）

当风停住脚步时候，已经轮回了几个春秋.

这句话会被拆成

风，停住，脚步，脚，步，时候，已经，轮回，轮，回了，回，几个，春秋
在elasticsearch中储存的映射关系如下（简化版，es中会有更多相关的内容，如词在文章中出现的次数也会保存，这是为了计算相关性）

词	文章在elasticsearch中保存的id
风	123
停住	123
脚步	123
...	123

这样我们就可以在elasticsearch中进行查询了，比如说我现在要查询“风和春秋”，elasticsearch就会在查询时把它拆分成

风，春秋

之后在elasticsearch的映射关系中找这两个词，找到对应的文章后通过相关度算法*（和词在文章中出现的次数，文章的长度等因素有关）返回我们所想搜索的结果，这样我们就可以获取到所要搜索的记录了。当然es内部的处理不会那么简单，但对es的单个节点来说，运行的思路就是这样。
这篇文章对elasticsearch进行了简单介绍，在下一部分，我会讲讲elasticsearch中为了实现倒排索引而与传统数据库有所不同的地方。

网友评论

本文标题：ElasticSearch使用总结（一）

本文链接：https://www.haomeiwen.com/subject/tqpssttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

ElasticSearch使用总结（一）

elasticsearch简单介绍

elasticsearch 全文检索的实现原理

相关文章