分词接口

作者: 果酱一一 | 来源:发表于2015-12-24 21:16 被阅读54次

接口描述

对输入的内容进行分词

请求方式只接受【GET】请求

http://localhost:port/index/_analyze?analyzer=ik&pretty=true&text=湖南省气象信息中心湖南省省内气象广域网络系统建设项目公开招标  
#### 具体地址单独给出 TEXT内容改变外,其它保持不变

请求参数说明

json数据格式,具体内容如下

参数 类型 说明
text string 要搜索的内容

------------------- 分隔线 ---------------


返回参数说明

参数 类型 说明
token String 分词结果

返回结果

{
    tokens: [
        {
            token: "湖南省",
            start_offset: 0,
            end_offset: 3,
            type: "CN_WORD",
            position: 1
        },
        {
            token: "气象",
            start_offset: 3,
            end_offset: 5,
            type: "CN_WORD",
            position: 2
        },
        {
            token: "信息中心",
            start_offset: 5,
            end_offset: 9,
            type: "CN_WORD",
            position: 3
        },
        {
            token: "湖南省",
            start_offset: 9,
            end_offset: 12,
            type: "CN_WORD",
            position: 4
        },
        {
            token: "省内",
            start_offset: 12,
            end_offset: 14,
            type: "CN_WORD",
            position: 5
        },
        {
            token: "气象",
            start_offset: 14,
            end_offset: 16,
            type: "CN_WORD",
            position: 6
        },
        {
            token: "广域",
            start_offset: 16,
            end_offset: 18,
            type: "CN_WORD",
            position: 7
        },
        {
            token: "网",
            start_offset: 28,
            end_offset: 29,
            type: "CN_CHAR",
            position: 8
        },
        {
            token: "络",
            start_offset: 44,
            end_offset: 45,
            type: "CN_WORD",
            position: 9
        },
        {
            token: "系统",
            start_offset: 66,
            end_offset: 68,
            type: "CN_WORD",
            position: 10
        },
        {
            token: "建设项目",
            start_offset: 68,
            end_offset: 72,
            type: "CN_WORD",
            position: 11
        },
        {
            token: "公开招标",
            start_offset: 72,
            end_offset: 76,
            type: "CN_WORD",
            position: 12
        }
    ]
}

相关文章

  • 分词接口

    接口描述 对输入的内容进行分词 请求方式只接受【GET】请求 请求参数说明 json数据格式,具体内容如下 ---...

  • 2020-06-15

    问题编号(图片中倒数第二列)接口问题说明1接口分词模块/wordseg/ 分词>>效果问题问题列举:伊斯兰国 分成...

  • Elasticsearch全文搜索引擎

    Elasticsearch 全文搜索引擎分布式 多用户 RESTful接口 java开发服务 支持中文分词搜索...

  • neo4j自定义中文分词插件

    新建maven项目 编写核心类 自定义分词器必须继承AnalyzerProvider 接口. 该类必须有默认的构造...

  • Elasticsearch实现中文、拼音分词、繁简体转换高级搜索

    一、Elasticsearch分词 分词分为读时分词和写时分词。 1.1 读时分词 读时分词发生在用户查询时,ES...

  • 初中英语语法(010)-分词

    分词 分词分为现在分词和过去分词,需要注意的是,现在分词和过去分词都是由动词变化而来,但现在分词不同于现在时,过去...

  • 中文自然语言处理工具hanlp隐马角色标注详解

    本文旨在介绍如何利用HanLP训练分词模型,包括语料格式、语料预处理、训练接口、输出格式等。 目前HanLP内置的...

  • 【英语】语法俱乐部_6_分词

    分词概述 分词包括现在分词(Ving)和过去分词(Vpp),是动状词的一个分支,分词在句子中可以视为形容词。 分词...

  • 分词

    分词分为现在分词和过去分词。 现在分词有主动进行的意思,过去分词有被动完成的意思。 分词的用法包括:作表语,作定语...

  • ES中文分词器之精确短语匹配(解决了match_phrase匹配

    分词器选择 调研了几种分词器,例如IK分词器,ansj分词器,mmseg分词器,发现IK的分词效果最好。举个例子:...

网友评论

    本文标题:分词接口

    本文链接:https://www.haomeiwen.com/subject/uhwvhttx.html