美文网首页
Elasticsearch 安装IK中文分词器并设置索引

Elasticsearch 安装IK中文分词器并设置索引

作者: 已不再更新_转移到qiita | 来源:发表于2018-05-02 20:20 被阅读106次

    本人的 Elasticsearch 版本是 6.2.3

    下载并安装插件

    ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.3/elasticsearch-analysis-ik-6.2.3.zip
    # sudo /usr/share/elasticsearch/bin/elasticsearch-plugin install http://localhost:8000/elasticsearch-analysis-ik-6.2.3.zip -v
    

    插件安装在 /usr/share/elasticsearch/plugins/
    插件的配置文件在 /etc/elasticsearch/analysis-ik
    测试下 sudo ./bin/elasticsearch-plugin list

    注意文件的权限

    当然也可以自己编译

    安装java Maven

    Maven 是一个项目管理和构建自动化工具, 类似 python的pipenv, nodejs的npm

    sudo apt-get install maven

    编译 elasticsearch-ik

    https://github.com/medcl/elasticsearch-analysis-ik.git
    git checkout v6.2.3
    mvn package
    

    重启 elasticsearch

    service elasticsearch restart

    设置中文索引

    curl -X PUT http://localhost:9200/weibo #新建一个index
    
    curl -XPUT http://localhost:9200/weibo/_mapping/news -H 'Content-Type: application/json' -d'
    {
      "properties": {
        "summary": {
          "type": "text",
          "analyzer": "ik_smart"
        },
        "title": {
          "type": "text",
          "analyzer": "ik_smart"
        }
      }
    }'
    

    ik_max_word: 会将文本做最细粒度的拆分,比如会将 "中华人民共和国国歌"拆分为
    "中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌",会穷尽各种可能的组合
    ik_smart: 会做最粗粒度的拆分, 比如会将 "中华人民共和国国歌"拆分为 "中华人民共和国,国歌" .


    参考:

    https://stackoverflow.com/questions/15630055/how-to-install-maven-3-on-ubuntu-17-04-16-10-16-04-lts-15-10-15-04-14-10-14-04-l
    https://github.com/medcl/elasticsearch-analysis-ik
    http://www.cnblogs.com/xing901022/p/5910139.html
    https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-put-mapping.html
    http://www.cnblogs.com/softidea/p/6081326.html

    相关文章

      网友评论

          本文标题:Elasticsearch 安装IK中文分词器并设置索引

          本文链接:https://www.haomeiwen.com/subject/hcgcrftx.html