美文网首页
Elasticsearch(一)

Elasticsearch(一)

作者: 吹破天 | 来源:发表于2017-12-21 14:36 被阅读0次

    Elasticsearch是一个分布式搜索服务。底层是开源库 Lucene,但是,你没法直接用 Lucene,必须自己写代码去调用它的接口。Elastic 是 Lucene 的封装,提供了 REST API 的操作接口,开箱即用。

    采用多shard的方式保证数据安全,并且提供自动resharding的功能,维基百科、Stack Overflow、Github 都采用它大型的站点也采用Elasticsearch作为其搜索服务

    Elasticsearch与Solr比较:https://www.cnblogs.com/chowmin/articles/4629220.html

http://blog.csdn.net/yangwenbo214/article/details/77802331

1.Elasticsearch是如何实现Master选举的?

Elasticsearch的选主是ZenDiscovery模块负责的,主要包含Ping(节点之间通过这个RPC来发现彼此)和Unicast(单播模块包含一个主机列表以控制哪些节点需要ping通)这两部分;

2.Elasticsearch是如何避免脑裂现象的?

🔪集群(Cluster): ES可以作为一个独立的单个搜索服务器。不过,为了处理大型数据集,实现容错和高可用性,ES可以运行在许多互相合作的服务器上。这些服务器的集合称为集群。

🔪节点(node):形成集群的每个服务器称为节点。

🔪 索引(Indices):含有相同属性的文档集合(英文字母小写且不含中划线)(--> 人)

🔪 分类(type):索引可以定义一个或多个类型,文档必须属于一个类型  (-->黑人黄人白人)

🔪 文档(document):文档是可以被索引的基本数据单位- (-> 具体的哪个人)

🔪 分片(shard):每个索引都有多个分片,每个分片是一个Lucene索引,好处:数据索引比较大,可以分担压力,提高效率

🔪 备份(replicas):拷贝一份分片就完成了分片的备份,好处,当某个节点某个分片损坏或丢失时可以从副本中恢复。

    每个索引默认5个分片一个备份,数量可以修改,分片的数量只能在创建索引时指定,而不能在后期修改,备份可以(分片和备份不会再同一节点)

http://blog.csdn.net/yangwenbo214/article/details/77802331

1.Elasticsearch是如何实现Master选举的?

    Elasticsearch的选主是ZenDiscovery模块负责的,主要包含Ping(节点之间通过这个RPC来发现彼此)和Unicast(单播模块包含一个主机列表以控制哪些节点需要ping通)这两部分

2.Elasticsearch是如何避免脑裂现象的?http://blog.csdn.net/yangwenbo214/article/details/77802331

一下载安装 Elasticsearch

    1.1我们从地址http://www.elasticsearch.org/download下载ELasticSearch工具包。解压到指定目录

    1.2进入bin 目录,双击执行elasticsearch.bat

       (如果报找不到环境参考https://www.cnblogs.com/qixuejia/p/5414948.html)

二.安装Head插件

1.下载node.js   ->  https://nodejs.org/en/

   速度不行可下载 ->http://nodejs.cn/download/

2.安装grunt 

    2.1grunt是一个很方便的构建工具,可以进行打包压缩、测试、执行等等的工作,5.0里的head插件就是通过grunt启动的。

       npm其实是Node.js的包管理工具(package manager) , npm已经在Node.js安装的时候顺带装好了

   2.2注意:路径切到D:\nodejs下  

     安装npm install -g grunt-cli

     检查grunt -version

3.安装head插件

3.1  git clone git://github.com/mobz/elasticsearch-head.git  

       或  https://github.com/mobz/elasticsearch-head

3.2切到head源码目录中,执行npm install 下载的包:

      npm  install

4.用head启动

    4.1 启动es下elasticsearch.bat

    4.2 切换head目录下 启动 

       grunt server

绿色:es服务正常运行很健康 

黄色:集群虽然可以正常使用,但不是很健康 

红色:集群虽然可以正常搜素数据,但是会出现丢失数据的问题

三.分布式安装

编辑ES文件下config ->elasticsearch.yml文件

(注意:1.编辑时候冒号后面要跟空格,2.创建子节点的一定要从解压后的文件,不要直接复制主节点的es文件)

3.1主节点:

3.2子节点:

3.3显示效果

四.新建索引

索引:结构索引和非结构索引

4.1 建立索引

4.2非结构索引

4.3 结构索引

4.4 POSTMAN创建结构索引

{

    "settings":{

      "number_of_shards":3,

      "number_of_replicas":1

    },

    "mappings":{

        "man":{

          "properties":{

                "name":{

                  "type":"text"

                },

                "country":{

                  "type":"keyword"

                },

                "age":{

                    "type":"integer"

                },

                "date":{

                    "type":"date",

                    "format":"yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"

                }

          }

        }

    }

}

4.5索引查看

5.查询

5.1高级查询包括

      子条件查询 特定字段查询所指特定值(包括Query context 和 Filter context)

      复合条件查询 以一定的逻辑组合子条件查询

5.2 Query context

        在查询过程中,除了判断文档是否满足查询条件外,ES还会计算一个"_score“来标识匹配的程度,来判断目标文档和查询条件匹配的”有多好“

其中常用查询包括:全文本查询:针对文本类型数据/字段级别查询,针对结构化数据,如数字,日期等

文本查询包括

match:模糊查询

match_phrase:短语查询

multi_match : 多个字段模糊查询

query_string : 语法查询

字段级别查询包括

term 具体项,也支持区间查询

Filter context

在查询过程中,只判断该文档是否满足条件,只有YES/NO,会有缓存,速度快

5.3复合条件查询

固定分数查询

布尔查询

more

相关文章

网友评论

      本文标题:Elasticsearch(一)

      本文链接:https://www.haomeiwen.com/subject/plhiwxtx.html