Solr对比:
- 实时性ES高于Solr
- Solr传统搜索性能高于ES
一、概念
-
索引(index)
存储数据到 Elasticsearch 的行为。
类比数据库:
索引---》数据库
类型---》表名
文档---》行
属性---》列 -
type(类型)
可以类似看成一个table,就是给文档分分类用的,通常,会为具有一组共同字段的文档定义一个类型。 -
documents (文档)
可以类似看成一个table下一行数据, 一个文档是一个可被索引的基础信息单元。 -
fields(字段,在lucene中叫域)
可以类似看成一个table的字段,对文档数据根据不同属性进行的分类标识 -
mapping(映射)
可以类似看成字段的数据类型和约束,mapping是处理数据的方式和规则方面做一些限制,如某个字段的数据类型、默认值、分析器、是否被索引等等 -
shards&replicas(分片&备份)
ES是分布式大数据量全文检索服务器,把文档数据切成片段,多个片合在一起是一个完整的数据。在分布式环境中很有就能出现单点故障问题,这时候需要备份每个片段会被复制和转移同步。 -
节点(node)
运行一个elasticsearch的实例。 -
集群(cluster)
多个相同cluser.name的节点集合。 -
分片(shards)
分片是一个是一个 Lucene 的实例,是索引的一个最小单元,也就是数据存储的最小的一个单元。 -
集群健康
green: 所有的主分片和副本分片都正常运行。
yellow: 所有的主分片都正常运行,但不是所有的副本分片都正常运行。
red:官网上是这样说的:有主分片没能正常运行。 -
倒排索引
常见索引分类:
线性索引:倒排索引、稠密索引、分块索引
树形索引
多级索引
不是由记录来确定属性值,而是由属性值来确定记录的位置,所以就成为倒排索引。
网友评论