jieba支持三种分词模式:
精确模式:试图将句子最精确地切开,适合文本分析;
全模式:把句子中所有的可以成词的词语都扫描出来,但是可能有歧义;
搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
详细内容访问项目源地址:https://github.com/fxsjy/jieba
jieba支持三种分词模式:
精确模式:试图将句子最精确地切开,适合文本分析;
全模式:把句子中所有的可以成词的词语都扫描出来,但是可能有歧义;
搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
详细内容访问项目源地址:https://github.com/fxsjy/jieba
本文标题:jieba:中文分词
本文链接:https://www.haomeiwen.com/subject/xxfdqhtx.html
网友评论