美文网首页
Elasticsearch(一)

Elasticsearch(一)

作者: 吹破天 | 来源:发表于2017-12-21 14:36 被阅读0次

        Elasticsearch是一个分布式搜索服务。底层是开源库 Lucene,但是,你没法直接用 Lucene,必须自己写代码去调用它的接口。Elastic 是 Lucene 的封装,提供了 REST API 的操作接口,开箱即用。

        采用多shard的方式保证数据安全,并且提供自动resharding的功能,维基百科、Stack Overflow、Github 都采用它大型的站点也采用Elasticsearch作为其搜索服务

        Elasticsearch与Solr比较:https://www.cnblogs.com/chowmin/articles/4629220.html

    http://blog.csdn.net/yangwenbo214/article/details/77802331

    1.Elasticsearch是如何实现Master选举的?

    Elasticsearch的选主是ZenDiscovery模块负责的,主要包含Ping(节点之间通过这个RPC来发现彼此)和Unicast(单播模块包含一个主机列表以控制哪些节点需要ping通)这两部分;

    2.Elasticsearch是如何避免脑裂现象的?

    🔪集群(Cluster): ES可以作为一个独立的单个搜索服务器。不过,为了处理大型数据集,实现容错和高可用性,ES可以运行在许多互相合作的服务器上。这些服务器的集合称为集群。

    🔪节点(node):形成集群的每个服务器称为节点。

    🔪 索引(Indices):含有相同属性的文档集合(英文字母小写且不含中划线)(--> 人)

    🔪 分类(type):索引可以定义一个或多个类型,文档必须属于一个类型  (-->黑人黄人白人)

    🔪 文档(document):文档是可以被索引的基本数据单位- (-> 具体的哪个人)

    🔪 分片(shard):每个索引都有多个分片,每个分片是一个Lucene索引,好处:数据索引比较大,可以分担压力,提高效率

    🔪 备份(replicas):拷贝一份分片就完成了分片的备份,好处,当某个节点某个分片损坏或丢失时可以从副本中恢复。

        每个索引默认5个分片一个备份,数量可以修改,分片的数量只能在创建索引时指定,而不能在后期修改,备份可以(分片和备份不会再同一节点)

    http://blog.csdn.net/yangwenbo214/article/details/77802331

    1.Elasticsearch是如何实现Master选举的?

        Elasticsearch的选主是ZenDiscovery模块负责的,主要包含Ping(节点之间通过这个RPC来发现彼此)和Unicast(单播模块包含一个主机列表以控制哪些节点需要ping通)这两部分

    2.Elasticsearch是如何避免脑裂现象的?http://blog.csdn.net/yangwenbo214/article/details/77802331

    一下载安装 Elasticsearch

        1.1我们从地址http://www.elasticsearch.org/download下载ELasticSearch工具包。解压到指定目录

        1.2进入bin 目录,双击执行elasticsearch.bat

           (如果报找不到环境参考https://www.cnblogs.com/qixuejia/p/5414948.html)

    二.安装Head插件

    1.下载node.js   ->  https://nodejs.org/en/

       速度不行可下载 ->http://nodejs.cn/download/

    2.安装grunt 

        2.1grunt是一个很方便的构建工具,可以进行打包压缩、测试、执行等等的工作,5.0里的head插件就是通过grunt启动的。

           npm其实是Node.js的包管理工具(package manager) , npm已经在Node.js安装的时候顺带装好了

       2.2注意:路径切到D:\nodejs下  

         安装npm install -g grunt-cli

         检查grunt -version

    3.安装head插件

    3.1  git clone git://github.com/mobz/elasticsearch-head.git  

           或  https://github.com/mobz/elasticsearch-head

    3.2切到head源码目录中,执行npm install 下载的包:

          npm  install

    4.用head启动

        4.1 启动es下elasticsearch.bat

        4.2 切换head目录下 启动 

           grunt server

    绿色:es服务正常运行很健康 

    黄色:集群虽然可以正常使用,但不是很健康 

    红色:集群虽然可以正常搜素数据,但是会出现丢失数据的问题

    三.分布式安装

    编辑ES文件下config ->elasticsearch.yml文件

    (注意:1.编辑时候冒号后面要跟空格,2.创建子节点的一定要从解压后的文件,不要直接复制主节点的es文件)

    3.1主节点:

    3.2子节点:

    3.3显示效果

    四.新建索引

    索引:结构索引和非结构索引

    4.1 建立索引

    4.2非结构索引

    4.3 结构索引

    4.4 POSTMAN创建结构索引

    {

        "settings":{

          "number_of_shards":3,

          "number_of_replicas":1

        },

        "mappings":{

            "man":{

              "properties":{

                    "name":{

                      "type":"text"

                    },

                    "country":{

                      "type":"keyword"

                    },

                    "age":{

                        "type":"integer"

                    },

                    "date":{

                        "type":"date",

                        "format":"yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"

                    }

              }

            }

        }

    }

    4.5索引查看

    5.查询

    5.1高级查询包括

          子条件查询 特定字段查询所指特定值(包括Query context 和 Filter context)

          复合条件查询 以一定的逻辑组合子条件查询

    5.2 Query context

            在查询过程中,除了判断文档是否满足查询条件外,ES还会计算一个"_score“来标识匹配的程度,来判断目标文档和查询条件匹配的”有多好“

    其中常用查询包括:全文本查询:针对文本类型数据/字段级别查询,针对结构化数据,如数字,日期等

    文本查询包括

    match:模糊查询

    match_phrase:短语查询

    multi_match : 多个字段模糊查询

    query_string : 语法查询

    字段级别查询包括

    term 具体项,也支持区间查询

    Filter context

    在查询过程中,只判断该文档是否满足条件,只有YES/NO,会有缓存,速度快

    5.3复合条件查询

    固定分数查询

    布尔查询

    more

    相关文章

      网友评论

          本文标题:Elasticsearch(一)

          本文链接:https://www.haomeiwen.com/subject/plhiwxtx.html