美文网首页
正则表达式提取文件的身份证号

正则表达式提取文件的身份证号

作者: 不懂球的2大业 | 来源:发表于2022-04-07 23:41 被阅读0次

    1.背景

    • 最近疫情防控,需要统计各个街道、乡镇收上来的重点人员的身份证号、手机号等其他信息,之后在录入统一的系统中。但是街道人员在收取的时候,难免会统计错误,这样的话数据录入系统会出现错误。但是系统做的比较粗糙,只能返回一串串类似“第94行身份证320xxx195xxxxxxxx11校验错误,请核查。”的提示信息,不能直接导出有问题的身份证号。因此需要在提示信息中提取出有问题的身份证号,再和各个街道、乡镇进行核对校验。

    2.实现代码

    import re
    # from unittest import result
    
    lst = []
    
    with open("hotels.txt","r") as f:
        for line in f.readlines():
            line = line.strip('\n')
            # print(line)
            result = re.search('(\d{15,19}|\d{15,17}(\d|X|x))',line)
            if result != None:
                lst.append(result.group())
                # print(result.group())
    
    with open("idnums.txt","w+") as f:
        for item in lst:
            f.write(item)
            f.write("\n")
    

    相关文章

      网友评论

          本文标题:正则表达式提取文件的身份证号

          本文链接:https://www.haomeiwen.com/subject/dyjesrtx.html