HanLP里使用DAT存取字典的方法

HanLP里使用DAT存取字典的方法

作者: lanlantian123 | 来源:发表于2019-02-27 16:32 被阅读0次

HanLP里使用DAT存取字典的方法
按钮控制及数据存取
利用HanLP计算中文词语语义相似度
利用HanLP计算中文词语语义相似度
如何使用Hanlp加载大字典
安装elasticsearch中文切词插件hanlp
python字典
Python字典
GO并发安全字典sync.map（2）
使用Hanlp加载大字典

CoreBiGramTableDictionary.java和CoreDictionary.java结构思路

词典里文件的格式：wordA@wordB frequency

CoreBiGramTableDictionary.java文件用一个TreeMap<(int)wordA, TreeMap<(int)wordB, (int)frequency>>来读取词典。用一个名为pair的int型数组来存储TreeMap<(int)wordB, (int)frequency>。因为一个wordA可能对应有多个wordB，所以用一个名为start的int型数组来记录wordA后面有多少个wordB（start[i] ~~~ start[i+1]）。

wordA和wordB的int数值从DAT的查询中来。

词典里文件的格式：word nature1 frequency1 nature2 frequency2 ......

CoreDictionary.java里用一个Attribute的内部类来保存词典里的每一列中word后的那些概率。

Attribute属性：Nature nature[];

int frequency[];

int totalFrequency;

接着用一个TreeMap<String, Attribute>来存储一列。

怎么build这个map到DAT里？

build(map<String, Attribute>) --> build(Set<String, Attribute>) --> List<String> keyList, List<Attribute> valueList --> build(keyList, valueList) --> DAT里的Attribute[] v := valueList, 最终到了原有的build()。

OK, finished.

文章来源于网络

相关文章

HanLP里使用DAT存取字典的方法
CoreBiGramTableDictionary.java和CoreDictionary.java结构思路词典...
按钮控制及数据存取
数据存取的几个注意点如有成对的数据出现最好使用字典数组定义字典数组的方法如下：删除控件的方法：按钮控制按...
利用HanLP计算中文词语语义相似度
HanLP官方GitHub地址 HanLP 在java项目中配置HanLP 推荐使用Maven方法在poem.x...
利用HanLP计算中文词语语义相似度
HanLP官方GitHub地址 HanLP 在java项目中配置HanLP 推荐使用Maven方法在poem.x...
如何使用Hanlp加载大字典
问题因为需要加载一个近1G的字典到Hanlp中，一开始使用了CustomDictionay.add() 方法来一...
安装elasticsearch中文切词插件hanlp
hanlp好处的,就是它的data字典比较齐全. github上有国人写hanlp支持es的插件 https://...
python字典
字典定义字典和列表一样可以存取多个数据。字典用{}（大括号）定义字典使用键值对储存数据字典是无序的对象集合键 k...
Python字典
字典定义字典和列表一样可以存取多个数据。字典用{}（大括号）定义字典使用键值对储存数据字典是无序的对象集合键 ke...
GO并发安全字典sync.map（2）
并发安全字典如何做到尽量避免使用锁？只读字典 sync.Map类型在内部使用了大量的原子操作来存取键和值，并使用...
使用Hanlp加载大字典
问题因为需要加载一个近 1G 的字典到Hanlp中，一开始使用了CustomDictionay.add() 方...

网友评论

本文标题：HanLP里使用DAT存取字典的方法

本文链接：https://www.haomeiwen.com/subject/nkmfuqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|HanLP里使用DAT存取字典的方法|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！