Elasticsearch核心概念和原理

Elasticsearch核心概念和原理

作者: GALAace | 来源:发表于2021-05-25 15:30 被阅读0次

Elasticsearch核心概念和原理
2,elasticsearch的核心概念
ES（Elasticsearch）核心概念
ElasticSearch 系列 - 基本概念
ElasticSearch 概念和原理初探
大数据技术之ElasticSearch(三)
ElasticSearch核心概念
ElasticSearch核心概念
Elasticsearch核心概念
ElasticSearch核心概念

搜索功能

使用传统关系型数据库做搜索存在：性能差(模糊查询可能会索引失效)、不可靠、结果不准确（相关度低）等问题，为解决这类问题，可以使用ES来处理搜索请求。ES的核心是倒排索引

倒排索引数据结构

包含这个关键词的document list
关键词在每个doc中出现的次数(词频) TF(term frequency)
关键词在整个索引中出现的次数 IDF (inverse doc frequency)
关键词在当前doc中出现的次数
每个doc的长度，越长相关度越低
包含这个关键词的所有doc的平均长度

Lucene

Lucene是一个jar包，帮我们创建倒排索引，提供复杂的API。Lucene是单点的，扩展相对复杂。

Elasticsearch

基于Lucene开发的分布式的搜索，存储和数据分析引擎
优点：
1. 面向开发者友好，屏蔽了Lucene的复杂性，集群自动发现
2. 自动维护数据在多个节点上的建立
3. 请求负载均衡
4. 自动维护冗余副本，部分节点宕机数据不会丢失
5. 提供高级功能，符合查询，聚合分析，基于地理位置等
6. 开箱即用，也可构建大型分布式集群，处理PB级数据
7. 提供全文检索，同义词处理，相关度排名，海量数据近实时处理
应用领域
1. 百度（全文检索，高亮，搜索推荐）
2.用户行为日志（用户点击、浏览、收藏、评论）
3. BI （business intelligence）商业智能，数据挖掘统计
4. ELK (Elasticsearch 数据存储 + Logstash 日志采集 + Kibana 可视化)

ES核心概念

Cluster（集群）：每个集群至少包含两个节点
Node（节点）：集群中的每个节点，一个节点不代表一台服务器
Field（字段）：一个数据字段，与index和type一起，可以定位一个doc
Document （文档）：ES最小的数据单元是json格式
Type：逻辑上的数据分类，es 7.x中删除了type的概念
Index：一类相同或者类似的doc，比如一个员工索引，商品索引

Shard分片：

一个index包含多个Shard，默认5个Primay，默认每个Primay分配一个Replica，Primay的数量在创建索引的时候设置，如果想修改，需要重建索引。
每个Shard都是一个Lucene实例，有完整的创建索引的处理请求能力。
ES会自动在nodes上为我们做shard 均衡。
一个doc是不可能同时存在于多个PShard中的，但是可以存在于多个RShard中。
Primay和对应的Replica不能同时存在于同一个节点，所以最低的可用配置是两个节点，互为主备。

相关文章

Elasticsearch核心概念和原理
搜索功能使用传统关系型数据库做搜索存在：性能差(模糊查询可能会索引失效)、不可靠、结果不准确（相关度低）等问题，...
2,elasticsearch的核心概念
1、lucene和elasticsearch的前世今生 2、elasticsearch的核心概念 3、elasti...
ES（Elasticsearch）核心概念
ES（Elasticsearch） Elasticsearch 核心概念。接近实时（NRT） Elasticse...
ElasticSearch 系列 - 基本概念
1.ElasticSearch的基本概念 1.1 概念 Elasticsearch有几个核心概念，先理解这些概念将...
ElasticSearch 概念和原理初探
是什么 Elasticsearch（简称ES）是一个基于Apache Lucene(TM)的开源搜索引擎Lunce...
大数据技术之ElasticSearch(三)
ElasticSearch核心概念概述 1、索引（ElasticSearch）包多个分片 2、字段类型（映射）...
ElasticSearch核心概念
核心概念 Cluster，服务节点集合，集群名称必须唯一，默认为"elasticsearch"。 Node，单服...
ElasticSearch核心概念
1、索引 Index ElaticSearch将数据存放在一个或多个索引当中。一个索引相当于一个数据库，里面存放用...
Elasticsearch核心概念
1.近实时近实时，两个意思，从写入数据到数据可以被搜索到有一个小延迟（大概1秒）；基于es执行搜索和分析可以达到...
ElasticSearch核心概念
Lucene 和 ES 的前世今生 Lucene 是最先进、功能最强大的搜索库。如果直接基于 Lucene 开发，...

网友评论

本文标题：Elasticsearch核心概念和原理

本文链接：https://www.haomeiwen.com/subject/daairltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Elasticsearch核心概念和原理|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！