一、ElasticSearch
ElasticSearch是一个基于Apache Lucene构建的开源搜索引擎,它提供了强大的全文搜索和分析功能。它不仅可以快速搜索和检索大量的结构化和非结构化数据,还具备水平扩展和高可用性的特性。
ElasticSearch索引——>mysql的数据库
ElasticSearch类型——>mysql的表
ElasticSearch文档——>mysql的数据
倒排索引
倒排索引是一种常见的索引结构,它在信息检索领域中具有重要的作用。与传统的正排索引不同,倒排索引以词项为基础,将文档的内容映射到词项上,提供了更高效的文本搜索和检索能力。以下是倒排索引的重要性:
-
高效的文本搜索:倒排索引通过将词项映射到文档列表中,可以快速定位包含特定词项的文档。相比于顺序扫描整个文档集合,倒排索引可以大大提高搜索效率。
-
支持复杂的查询操作:倒排索引不仅可以进行简单的词项匹配,还可以支持布尔运算、范围查询、模糊搜索和通配符搜索等复杂查询操作。这使得用户可以灵活地组合和过滤搜索条件,从而获取更精确的搜索结果。
-
提供相关性排序:倒排索引中的每个词项都包含了它在每个文档中的出现位置和频率信息。这使得搜索引擎可以根据相关性算法计算文档的匹配度,并按照相关性对搜索结果进行排序,使用户能够更快速地找到最相关的文档。
-
支持实时更新和增量索引:倒排索引可以支持实时的数据更新和增量索引。当新的文档被添加或旧文档被修改时,只需更新相应的倒排索引项,而无需重新构建整个索引结构。这使得搜索引擎能够快速响应数据的变化,并实时提供最新的搜索结果。
分词:将整句分拆为单词
保存的记录
1-红海行动
2-探索红海行动
3-红海特别行动
4-红海记录篇
5-特工红海特别探索
检索:
1)、红海特工行动?
2)、红海行动?
网友评论