美文网首页
利用HanLP计算中文词语语义相似度

利用HanLP计算中文词语语义相似度

作者: citySouth | 来源:发表于2017-05-19 11:52 被阅读0次

    HanLP官方GitHub地址

    HanLP

    在java项目中配置HanLP

    推荐使用Maven方法

    在poem.xml中加入以下代码

    <dependency>
        <groupId>com.hankcs</groupId>
        <artifactId>hanlp</artifactId>
        <version>portable-1.3.3</version>
    </dependency>
    

    但是在AndroidStudio中,没有Maven,所以在build.gradle的dependencies中加入如下代码

    compile "com.hankcs:hanlp:portable-1.3.3"
    

    还可以下载jar包和data包,使用hanlp.properties进行手动配置

    1. 在 IntelliJ IDEA中进入file -> project structure,在Libraries中添加jar包

    2. 更改hanlp.properties中的首行,指向data包所在的位置

    3. 将hanlp.properties放在out -> production -> name目录下

    调用HanLP

    import com.hankcs.hanlp.dictionary.CoreSynonymDictionary;
    

    只需要以上语句便可以使用HanLP

    //使用hanlp计算语义距离
    double[] numarray = new double[title_list.size()];
        for (int i = 0; i < results.size(); i++) {
            for (int j = 0; j < title_list.size(); j++) {
                numarray[j] += CoreSynonymDictionary.similarity(results.get(i).name().toString(), title_list.get(j).toString());
            }
        }
    

    相关文章

      网友评论

          本文标题:利用HanLP计算中文词语语义相似度

          本文链接:https://www.haomeiwen.com/subject/axhyxxtx.html