美文网首页
默认分词器

默认分词器

作者: zjkdifvpwlkqumn | 来源:发表于2020-07-19 17:49 被阅读0次

    ES的默认分词设置是standard,这个在中文分词时就比较尴尬了,会单字拆分,比如我搜索关键词“清华大学”,这时候会按“清”,“华”,“大”,“学”去分词,然后搜出来的都是些“清清的河水”,“中华儿女”,“地大物博”,“学而不思则罔”之类的莫名其妙的结果,这里我们就想把这个分词方式修改一下,于是呢,就想到了ik分词器,有两种ik_smart和ik_max_word。

        ik_smart会将“清华大学”整个分为一个词,而ik_max_word会将“清华大学”分为“清华大学”,“清华”和“大学”,按需选其中之一就可以了。
    

    修改默认分词方法(这里修改school_index索引的默认分词为:ik_max_word):

    PUT /school_index
    {
    "settings" : {
    "index" : {
    "analysis.analyzer.default.type": "ik_max_word"
    }
    }
    }
    ————————————————
    版权声明:本文为CSDN博主「攻城狮阿楠」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/tclzsn7456/article/details/79957545

    相关文章

      网友评论

          本文标题:默认分词器

          本文链接:https://www.haomeiwen.com/subject/scdrkktx.html