ElasticSearch分词器

作者: 蓝色Hippie | 来源:发表于2020-09-07 06:49 被阅读0次

一个非常hao用的elasticsearch中文分词器插件 Ha
elk--笔记6-安装ik分词器
elasticsearch安装与使用
ElasticSearch安装中文分词器IKAnalyzer
Elasticsearch集成HanLP分词器
elasticsearch ik分词器安装
（七）安装中文分词组件
Elasticsearch 中文分词器
ElasticSearch 分词器，了解一下
Elasticsearch插件之分词ik

一、什么是分词

把文本转换为一个个的单词，分词称为analysis。es默认只对英文语句做分词，中文不支持。每个中文都会被拆分为独立的个体

分词测试： POST url/_analyze

body:

{

"analyzer": "standard",

"text": "i am a hero, i love the world"

}

二、es内置分词器

1.内置英文分词器

standard：默认分词器，单词会被拆分，大小写会转换为小写

simple:：按照非字母分词，大写转为小写

whitespace：按照空格分词，忽略大小写

stop：去除无意义的单词，例如 the a an is

keyword：不做分词，把整个文本作为一个单独的关键字

2.安装中文分词器插件

https://github.com/medcl/elasticsearch-analysis-ik

2.1下载后安装到服务器，解压后放到指定文件夹，重启即可。

2.2中文分词器 ik_max_word

会将文本做最细粒度的拆分，比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”，会穷尽各种可能的组合，适合 Term Query

2.3中文分词器 ik_smart

会做最粗粒度的拆分，比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”，适合 Phrase 查询

2.4自定义中文词库

在{es}/plugins/conf下，创建文件：vim custom.dic，并录入自定义词汇

在{es}/plugins/conf/IKAnalyzer.cfg.xml，增加配置<entry key="ext_dict">custom.dic</entry>

重启即可

网友评论

本文标题：ElasticSearch分词器

本文链接：https://www.haomeiwen.com/subject/dkjfektx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

ElasticSearch分词器

相关文章

一个非常hao用的elasticsearch中文分词器插件 Ha

elk--笔记6-安装ik分词器

elasticsearch安装与使用

ElasticSearch安装中文分词器IKAnalyzer

Elasticsearch集成HanLP分词器

elasticsearch ik分词器安装

（七）安装中文分词组件

Elasticsearch 中文分词器