elasticsearch 常见面试问题整理（1）

作者: 裘马轻狂大帅 | 来源:发表于2020-06-20 15:56 被阅读0次

elasticsearch 常见面试问题整理（1）
Linux 1
iOS经典面试题集整理
ElasticSearch 5 安装部署常见错误或问题
【面试】面试常见问题整理
面试常见问题整理
Java面试题集：Spring常见面试问题及答案
css居中方式
2018 前端面试准备
Java 面试常见问题整理

Elasticsearch 在部署时，对 Linux 的设置有哪些优化方法？

1、关闭缓存 swap;2、堆内存设置为：Min（节点内存/2, 32GB）;3、设置最大文件句柄数；4、线程池+队列大小根据业务需要做调整；5、磁盘存储 raid 方式——存储有条件使用 RAID10，增加单节点性能以及避免单节点存储故障

Elasticsearch是如何实现Master选举的？

Elasticsearch的选主是ZenDiscovery模块负责的，主要包含Ping（节点之间通过这个RPC来发现彼此）和Unicast（单播模块包含一个主机列表以控制哪些节点需要ping通）这两部分；

对所有可以成为master的节点（node.master: true）根据nodeId字典排序，每次选举每个节点都把自己所知道节点排一次序，然后选出第一个（第0位）节点，暂且认为它是master节点。

如果对某个节点的投票数达到一定的值（可以成为master节点数n/2+1）并且该节点自己也选举自己，那这个节点就是master。否则重新选举一直到满足上述条件。

补充：master节点的职责主要包括集群、节点和索引的管理，不负责文档级别的管理；data节点可以关闭http功能。

Elasticsearch对于大数据量（上亿量级）的聚合如何实现？

Elasticsearch 提供的首个近似聚合是cardinality 度量。它提供一个字段的基数，即该字段的distinct或者unique值的数目。它是基于HLL算法的。HLL 会先对我们的输入作哈希运算，然后根据哈希运算的结果中的 bits 做概率估算从而得到基数。其特点是：可配置的精度，用来控制内存的使用（更精确＝更多内存）；小的数据集精度是非常高的；我们可以通过配置参数，来设置去重需要的固定内存使用量。无论数千还是数十亿的唯一值，内存使用量只与你配置的精确度相关 .

网友评论

超级大数据

本文标题：elasticsearch 常见面试问题整理（1）

本文链接：https://www.haomeiwen.com/subject/sefgxktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

elasticsearch 常见面试问题整理（1）

Elasticsearch 在部署时，对 Linux 的设置有哪些优化方法？

Elasticsearch是如何实现Master选举的？

Elasticsearch对于大数据量（上亿量级）的聚合如何实现？

相关文章

elasticsearch 常见面试问题整理（1）

Linux 1

iOS经典面试题集整理

ElasticSearch 5 安装部署常见错误或问题

【面试】面试常见问题整理

面试常见问题整理

Java面试题集：Spring常见面试问题及答案

css居中方式

2018 前端面试准备

Java 面试常见问题整理

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

超级大数据