美文网首页超级大数据
elasticsearch 常见面试问题整理(1)

elasticsearch 常见面试问题整理(1)

作者: 裘马轻狂大帅 | 来源:发表于2020-06-20 15:56 被阅读0次

Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法?

1、关闭缓存 swap;2、堆内存设置为:Min(节点内存/2, 32GB);3、设置最大文件句柄数;4、线程池+队列大小根据业务需要做调整;5、磁盘存储 raid 方式——存储有条件使用 RAID10,增加单节点性能以及避免单节点存储故障

Elasticsearch是如何实现Master选举的?

Elasticsearch的选主是ZenDiscovery模块负责的,主要包含Ping(节点之间通过这个RPC来发现彼此)和Unicast(单播模块包含一个主机列表以控制哪些节点需要ping通)这两部分;

对所有可以成为master的节点(node.master: true)根据nodeId字典排序,每次选举每个节点都把自己所知道节点排一次序,然后选出第一个(第0位)节点,暂且认为它是master节点。

如果对某个节点的投票数达到一定的值(可以成为master节点数n/2+1)并且该节点自己也选举自己,那这个节点就是master。否则重新选举一直到满足上述条件。

补充:master节点的职责主要包括集群、节点和索引的管理,不负责文档级别的管理;data节点可以关闭http功能。

Elasticsearch对于大数据量(上亿量级)的聚合如何实现?

​ Elasticsearch 提供的首个近似聚合是cardinality 度量。它提供一个字段的基数,即该字段的distinct或者unique值的数目。它是基于HLL算法的。HLL 会先对我们的输入作哈希运算,然后根据哈希运算的结果中的 bits 做概率估算从而得到基数。其特点是:可配置的精度,用来控制内存的使用(更精确 = 更多内存);小的数据集精度是非常高的;我们可以通过配置参数,来设置去重需要的固定内存使用量。无论数千还是数十亿的唯一值,内存使用量只与你配置的精确度相关 .

相关文章

  • elasticsearch 常见面试问题整理(1)

    Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法? 1、关闭缓存 swap;2、堆内存设...

  • Linux 1

    1 面试常见的Linux命令及问题整理 1 面试常见的Linux命令及问题整理 Linux命令1 ls -a -l...

  • iOS经典面试题集整理

    1、Runtime面试中问题整理 2、Runloop面试中问题整理 3、KVO面试中问题整理 4、Block面试中...

  • ElasticSearch 5 安装部署常见错误或问题

    ElasticSearch 5 安装部署常见错误或问题 问题1: uncaught exception in th...

  • 【面试】面试常见问题整理

    LR和SVM的区别 相同点:1、都是监督、分类算法,且一般处理二分类问题2、两个方法都可以增加不同的正则化项,如l...

  • 面试常见问题整理

    一 网络 TCP三次握手第一次握手:起初两端都处于CLOSED关闭状态,Client将标志位SYN置为1,随机产生...

  • Java面试题集:Spring常见面试问题及答案

    整理了18道Java面试题,Spring常见面试问题及答案。 1 Spring 框架有哪些主要模块? 截止到目前S...

  • css居中方式

    样式居中的方式也是在web面试中比较常见的问题,笔者也整理了几种常见实现方式,有不足之前请指出学习 1.paddi...

  • 2018 前端面试准备

    前端面试常见问题按知识点分类整理 前端面试常考问题整理,按模块知识点分类,持续完善中... Front-end-D...

  • Java  面试常见问题整理

    问题: 重写和重载的区别 接口和抽象类的区别,各有什么特点 谈谈 final, finally, finalize...

网友评论

    本文标题:elasticsearch 常见面试问题整理(1)

    本文链接:https://www.haomeiwen.com/subject/sefgxktx.html