美文网首页
python 比较短文本相似性(difflib、fuzzywuz

python 比较短文本相似性(difflib、fuzzywuz

作者: 逍遥_yjz | 来源:发表于2018-10-16 11:10 被阅读0次

1 模糊字符串匹配字符串

from fuzzywuzzy import fuzz
from fuzzywuzzy import process
import difflib
s1 = "你们公司在哪里"
s2 = "你家的公司地址在哪里" # 71
s2 = "我不需要亲"   # 0
print(fuzz.ratio(s1, s2))  # 0,71

a = u'价格怎么样'
b = u'怎么卖的'
print(difflib.SequenceMatcher(None, a, b).ratio())

输出:

67
0.4444444444444444

https://github.com/seatgeek/fuzzywuzzy
参考资料:
python fuzzywuzzy模块 模糊字符串匹配详细用法
difflib

相关文章

网友评论

      本文标题:python 比较短文本相似性(difflib、fuzzywuz

      本文链接:https://www.haomeiwen.com/subject/vnyfzftx.html