elasticsearch使用笔记

作者: 狐尼克朱迪 | 来源:发表于2017-02-20 17:45 被阅读0次

Elasticsearch学习笔记目录
Elasticsearch学习笔记
ElasticSearchx
elasticsearch使用笔记
ElasticSearch 入门总结
ElasticSearch
2018-07-12（Elasticsearch）
实战：php（Yii2为例）中使用Elasticsearch作为
写在开始的话
SpringBoot整合Elasticsearch报错avail

资源

Elasticsearch 权威指南：看完后能了解elasticsearch的基本概念和使用方法
Download Elasticsearch：elasticsearch资源的下载页
Elasticsearch教程：详细介绍elasticsearch的使用和安装方法

安装

使用2.3.4版本的elasticsearch，下载地址：
elasticsearch下载后，在bin里有elasticsearch执行文件，执行后浏览器打开地址：http://localhost:9200/ 就可以判断安装是否成功：

选择elasticsearch版本时，需要参考插件或者工具支持的版本。由于数据库内容elasticsearch-jdbc能支持的版本是2.3.4，所以选择了此版本。

jprante/elasticsearch-jdbc用于同步数据：
elasticsearch-jdbc的使用可以参考bin文件夹下的内部例子，mysql-geo-points.sh的注释中给出了使用方法：
安装elasticsearch 以及运行elasticsearch
安装mysql（可以本地，也可以链接远程服务器）
执行命令

我在使用时,执行了命令，一直提示显示传输的数据为0，后来总结起来是两个原因：

端口号错了：默认情况下，应该是9300，不是9200
sql语句：除非有参数可以借鉴mysql-blog.sh中的写法，要不直接需要直接写：

```
DIR="$( cd "$( dirname "${BASH_SOURCE[0]}" )" && pwd )"
bin=${DIR}/../bin
lib=${DIR}/../lib

echo '
{
    "type" : "jdbc",
    "jdbc" : {
        "url" : "jdbc:mysql://127.0.0.1:3306/test",
        "user" : "user",
        "password" : "password",
        "sql" : "select id as _id, id, name as title from test",
        "index" : "test",
        "type" : "test",
        "metrics": {
            "enabled" : true
        },
        "elasticsearch" : {
             "cluster" : "law-application",
             "host" : "localhost",
             "port" : 9300 
        }   
    }
}
' | java \
    -cp "${lib}/*" \
    -Dlog4j.configurationFile=${bin}/log4j2.xml \
    org.xbib.tools.Runner \
    org.xbib.tools.JDBCImporter
```

插件

1. elasticsearch head

elasticsearch head 是集群管理工具，数据可视化、增删改查工具，语句可视化。安装好后，访问地址：http://localhost:9200/_plugin/head/
安装方法分两种，推荐第一种：

elasticsearch/bin/plugin install mobz/elasticsearch-head
从https://github.com/mobz/elasticsearch-head下载ZIP包。在 elasticsearch 目录下创建录/plugins/head/_site并将刚刚解压的elasticsearch-head-master目录下所有内容COPY到当前创建的/plugins/head/_site/目录下即可。

2. ik中文分词

elasticsearch自带的分词器是把中文不安装语义一个个汉字进行切分，浏览器中输入： http://localhost:9200/_analyze?analyzer=standard&pretty=true&text=sojson在线工具，显然不是我们想要的结果。
ik中文分词可以通过词典给出一串中文的恰当分词，安装后在浏览器中输入http://localhost:9200/_analyze?analyzer=ik&pretty=true&text=sojson在线工具可以查看结果。

安装：

从github elasticsearch-analysis-ik上拉取下源代码，git tag可以查看所有的分支，切换到elasticsearch版本对应的分支。
在文件夹下执行：mvn clean package，编译出目标文件。因为maven比较慢，可以借助阿里镜像提速。在maven安装文件夹(我用的是apache-maven-3.3.9)的conf文件夹下有个settings.xml文件，在<mirrors>标签下添加，添加后如下：

<mirrors>
    <mirror>
      <id>alimaven</id>
      <name>aliyun maven</name>
      <url>http://maven.aliyun.com/nexus/content/groups/public/</url>
      <!--<mirrorOf>central</mirrorOf> -->
    <mirrorOf>*</mirrorOf>
    </mirror>
  </mirrors>

编译后，在target/releases下有个zip压缩文件。首先在elasticsearch的plugins文件加下创建一个ik文件夹，然后把target/releases下的zip文件copy到plugins/ik文件夹下，解压。
重启elasticsearch，安装成功。

配置

ik的配置有个两个方式：

ik_max_word：会将文本做最细粒度的拆分，例如「中华人民共和国国歌」会被拆分为「中华人民共和国、中华人民、中华、华人、人民共和国、人民、人、民、共和国、共和、和、国国、国歌」，会穷尽各种可能的组合；
ik_smart：会将文本做最粗粒度的拆分，例如「中华人民共和国国歌」会被拆分为「中华人民共和国、国歌」；

可以比对下面两者的差别：
http://localhost:9200/_analyze?analyzer=ik_smart&pretty=true&text=sojson宪法中规定后续进行了司法解释
http://localhost:9200/_analyze?analyzer=ik&pretty=true&text=sojson宪法中规定后续进行了司法解释

在elasticsearch的elasticsearch.yml文件中可以配置ik：

index: 
  analysis: 
  analyzer: 
    ik: 
      alias: [ik_analyzer]
      type: org.elasticsearch.index.analysis.IkAnalyzerProvider
    ik_max_word: 
      type: ik
      use_smart: false
    ik_smart: 
      type: ik
      use_smart: true
  index.analysis.analyzer.default.type: ik  #默认的analyzer

在配置elasticsearch.yml时需要特别注意： 1、属性前至少两个空格 2、冒号:后至少一个空格。这些都是yml解析器的bug，elasticsearch按照配置时遇到的一些坑 [Failed to load settings from [elasticsearch.yml]]中，作者描述了遇到的问题。