ratio对位置敏感 完全匹配
from fuzzywuzzy import fuzz
from fuzzywuzzy import process
str1 = '专业'
str2 = '专 a 业!1111'
fuzz.ratio(str2, str1)
29
partial_ratio 对位置敏感 模糊匹配
fuzz.partial_ratio(str2, str1)
50
_process_and_sort 字符排序 force_ascii=True 字符转化成ascii排序,full_process=True 大写转小写 并去除数字 字母之外的特殊符号 (内部方法)
str3 = '个,,, higk 人 lmn ...[[]]k;;; 简 XyZ 历'
fuzz._process_and_sort(str3, force_ascii=True, full_process=False)
'...[[]]k;;; XyZ higk lmn 个,,, 人 历 简'
排序并完全匹配 token_sort_ratio
str1 = ' i am li ning'
str2 = ' ning li am i'
fuzz.token_sort_ratio(str1,str2)
100
排序并模糊匹配
str3 = 'today is good day '
str4 = 'good day is today , 我的英语咋样'
fuzz.partial_token_sort_ratio(str3,str4)
100
token_set_ratio 排序并剔除重复元素匹配
str5= 'zhang yan yan qiang '
str6= 'zhang yan qiang'
fuzz.token_set_ratio(str6,str5)
100
process.extractBests(query, choices, processor=default_processor, scorer=default_scorer, score_cutoff=0, limit=5) 查询字符串在字符数组各个字段相似度 score_cutoff 相似度大于此值的才输出
strList1 = ['个 人 简 历','专业:sfsdf', '(Personal Particulars)', '', '个人概况 (Personal Data)', '姓 名杨--- 籍 贯成都', '出生年月1986年3月5日 毕业院校西南科技大学', '专 业国际经济与贸易 学 历重点本科', '联系方式13----', 'E-mail -------qq.com', '邮寄地址成都市海椒市--号', '邮 编621000', '求职意向开发工程师', '毕业时间 2014年06月30日 性别女', '', '基本技能 (Basic Skills)', '英语水平具备良好的英语听、说、写、译能力已通过CET-4、CET-6考试', '计算机水平已学习计算机基础、VB语言程序设计、VF数据库、C语言能够熟练运用Windows操作系统和Office等办公软件', '', '所学主干课程 (Basic Courses)', '会计学原理、西方经济学、财政学、国际金融学、统计学原理、财务会计、货币银行学、国际贸易学、计量经济学、国际经济学、市场营销学、国际商务、政治经济学、国际营销学、现代物流管理、发展经济学、国际经济学、国际经济学、外贸函电、国际结算、国际经济学、国际商法、高等数学、大学英语、中央银行学等', '', '社会实践及所获奖励 (Social Practice Rewards)', '社会实践', '2005年在学校销售动感地带手机卡、小灵通以及一些学习用品', '2005年寒假期间在成都市长城通讯城推销手机以及客户信息收集工作', '2006年寒假在绵阳嘉信沃尔玛广场参与开业活动的策划以及相关管理工作', '2007年暑假在上海市申真阿里佳托涂料有限公司绵阳分公司做涂料销售工作', '所获奖励', '2003年获得盐道街中学校三好、成都市市三好', '参加西南科技大学迎新晚会并获得二等奖', '2004-2005年获得院级学习成绩优秀奖', '参加西南科技大学金鑫杯演讲比赛并获得优胜奖', '2005-2006年获得院级三好学生', '2007年获得社会实践先进个人奖(简历模板来自个人简历网)', '', '个人特长 (Personal Specialty)', '爱好运动爱好文学、音乐写作能力以及语言能力强特别是英语功底较强善交际管理协作能力突出能充分并成功的运用于实际中', '', '个人评价 (Personal Valuation)', '以高于省重点分数的成绩考入大学重点本科在校期间曾多次获得校级、院级奖励主动参与学校社团活动积极参与校外工作实践业绩突出多项工作获得领导好评丰富的经历培养了我良好的沟通协调能力执行能力同时也让我具备了强烈的职业道德和团队精神富有朝气敢于挑战', '非常感谢您对我简历的关注!']
result2 = process.extractBests('专业', strList1,score_cutoff=20)
print(result2)
[('专业:sfsdf', 90), ('出生年月1986年3月5日 毕业院校西南科技大学', 30), ('专 业国际经济与贸易 学 历重点本科', 30), ('毕业时间 2014年06月30日 性别女', 30), ('2006年寒假在绵阳嘉信沃尔玛广场参与开业活动的策划以及相关管理工作', 30)]
网友评论