es是什么
- 分布式的实时文件存储,每个字段都被索引并可被搜索
- 分布式的实时分析搜索引擎
- 可以扩展到上百台服务器,处理PB级结构化或非结构化数据
es:面向文档
我们知道,关系型数据库以记录和行的形式存储数据,但是ElasticSearch中,是以文档的形式存储数据。
但区别在于,文档要比数据表的行更加灵活。因为文档可以是多层次的,文档鼓励你将属于一个逻辑试题的数据保存在同一个文档中,而不是散落在各个表的不同行中,这样查询效率很高,因为我们无需连接其他的表,我们学习关系型数据库时,一定知道链表查询是多么费时的。
es索引能处理多大的数据
单一索引的极限取决于存储索引的硬件、索引的设计、如何处理数据以及你为索引备份了多少副本。
通常来说,一个ElasticSearch分片,不能处理多于21亿偏文档,或者多于2740亿的唯一词条,但达到这个极限之前,我们可能就没有足够的磁盘空间了。当然一个分片如果很大的话,读写性能将会变得非常差。
es优缺点
es是一个基于Lucene的搜索服务器,他提供了一个分布式多用户能力的全文检索引擎,基于restful web接口,es用java开发,是当前流行的企业级搜索引擎,设计用于云计算中,能够达到实时搜索,稳定可靠,快速,安装使用方便。
优点:
- 分布式:节点对外表现对等,加入节点自动均衡
- ElasticSearch完全支持Apache Lucene的接近实时搜索
- 各节点组成对等的网络结构,当某结点出现故障时会自动分配其他节点代替其进行工作
- 横向可扩展,如果你需要增加一台服务器,只需要做点配置,然后启动就完事了
- 高可用:提供复制机制,一个分片可以设置多个复制,是的某台服务器宕机的情况下,集群仍可以照常运行,并会把由于服务器宕机丢失的复制恢复到其他可用节点上;这点类似于HDFS的复制机制
缺点:
- 不支持事务
- 相对吃内存
网友评论