美文网首页
python 比较短文本相似性(difflib、fuzzywuz

python 比较短文本相似性(difflib、fuzzywuz

作者: 逍遥_yjz | 来源:发表于2018-10-16 11:10 被阅读0次

    1 模糊字符串匹配字符串

    from fuzzywuzzy import fuzz
    from fuzzywuzzy import process
    import difflib
    s1 = "你们公司在哪里"
    s2 = "你家的公司地址在哪里" # 71
    s2 = "我不需要亲"   # 0
    print(fuzz.ratio(s1, s2))  # 0,71
    
    a = u'价格怎么样'
    b = u'怎么卖的'
    print(difflib.SequenceMatcher(None, a, b).ratio())
    

    输出:

    67
    0.4444444444444444
    

    https://github.com/seatgeek/fuzzywuzzy
    参考资料:
    python fuzzywuzzy模块 模糊字符串匹配详细用法
    difflib

    相关文章

      网友评论

          本文标题:python 比较短文本相似性(difflib、fuzzywuz

          本文链接:https://www.haomeiwen.com/subject/vnyfzftx.html