美文网首页
jieba分词

jieba分词

作者: 是我真的是我 | 来源:发表于2019-12-01 13:27 被阅读0次

简略示例

import jieba

#精确模式
#将句子最精确的切开,适合做文本分析
res = jieba.lcut('我开始学习jieba了')
print(res)
# ['我', '开始', '学习', 'jieba', '了']

#全模式
#把句子中所有可能成词的都扫描出来,但不能解决歧义
res = jieba.lcut('今天真是个好天气', cut_all=True)
print(res)
# ['今天', '天真', '真是', '个', '好', '天气']

#搜索引擎模式
#在精确搜素模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词
res = jieba.lcut_for_search('我们应该采取必要的行动才能解决问题')
print(res)
# ['我们', '应该', '采取', '必要', '的', '行动', '才能', '解决', '问题', '解决问题']

更多参考第三方详解:jieba

相关文章

网友评论

      本文标题:jieba分词

      本文链接:https://www.haomeiwen.com/subject/oxuzwctx.html