Jieba对中文进行分词,用户可以自建自己的词典,将一些特殊名词或者固定名词放在里面,jieba在分词时,将字典中的词作为固定词不再拆解,提高分词的准确性。现在遇到一个问题,例如“史记·大宛列传”,这种是一个词,但是中间有一个黑点,这样jieba就不能识别到“史记·大宛列传”是一个词。该如何解决?
Jieba对中文进行分词,用户可以自建自己的词典,将一些特殊名词或者固定名词放在里面,jieba在分词时,将字典中的词作为固定词不再拆解,提高分词的准确性。现在遇到一个问题,例如“史记·大宛列传”,这种是一个词,但是中间有一个黑点,这样jieba就不能识别到“史记·大宛列传”是一个词。该如何解决?
本文标题:userdict遇到的问题
本文链接:https://www.haomeiwen.com/subject/boeoqqtx.html
网友评论