美文网首页
03-web服务器v3.1--01

03-web服务器v3.1--01

作者: 努力爬行中的蜗牛 | 来源:发表于2018-11-07 22:23 被阅读7次
    正则表达式
    1.匹配单个字符
    字符 功能
    . 匹配任意1个字符(除了\n)
    [ ] 匹配[ ]中列举的字符
    \d 匹配数字
    \D 匹配非数字,即不是数字
    \s 匹配空白,即空格,tab键
    \S 匹配非空白
    \w 匹配单词字符,即a-z、A-Z、0-9、_
    \W 匹配非单词字符
    import re
    
    # .
    result = re.match(r"速度与激情.", "速度与激情%")
    print(result.group())
    
    # [ ]
    result = re.match(r"速度与激情[1-8]", "速度与激情1")
    print(result.group())
    
    result = re.match(r"速度与激情[1-36-8]", "速度与激情1")
    print(result.group())
    
    result = re.match(r"速度与激情[1-36-8abc]", "速度与激情a")
    print(result.group())
    
    result = re.match(r"速度与激情[1-36-8a-zA-Z]", "速度与激情A")
    print(result.group())
    
    # \w
    result = re.match(r"速度与激情[\w]", "速度与激情E")
    print(result.group())
    
    result = re.match(r"速度与激情[\w]", "速度与激情_")
    print(result.group())
    
    result = re.match(r"速度与激情[\w]", "速度与激情哈")
    print(result.group())
    
    # \d
    result = re.match(r"速度与激情[\d]", "速度与激情1")
    print(result.group())
    
    # \s
    result = re.match(r"速度与激情\s1", "速度与激情 1")
    print(result.group())
    
    匹配多个字符
    字符 功能
    * 匹配前一个字符出现0次或者无限次,即可有可无
    + 匹配前一个字符出现1次或则无限次,即至少1次
    匹配前一个字符出现1次或者0次,即要么有要么没有
    {m} 匹配前一个字符出现m次
    {m,n} 匹配前一个字符出现m次到n次
    {m,} 匹配前一个字符出现至少m次
    # {m,n}
    result = re.match(r"速度与激情\d{1,2}", "速度与激情1")
    print(result.group())
    
    # {m}
    result = re.match(r"021-\d{8}", "021-87634566")
    print(result.group())
    
    # {m,}
    result = re.match(r"速度与激情\d{1,}", "速度与激情12")
    print(result.group())
    
    # ?
    result = re.match(r"021-?\d{8}", "02187634566")
    print(result.group())
    
    result = re.match(r"\d{3,4}-?\d{7,8}", "0765-8763456")
    print(result.group())
    
    # *
    result = re.match(r".*", "0765-87634df56")
    print(result.group())
    
    html_content = """kdjf
    djk
    djfk
    kdjf
    jdf
    """
    result = re.match(r".*", html_content, re.S)
    print(result.group())
    
    # +
    result = re.match(r".+", "df")
    print(result.group())
    
    匹配开头结尾
    字符 功能
    ^ 匹配字符开头
    $ 匹配字符结尾
    import re
    
    # python match 默认匹配开头
    def main():
        names = ["age", "_age", "lage", "age1", "a_age", "age_1_", "age!", "a#123", "___"]
        for name in names:
            ret = re.match("^[a-z][A-Z_][a-z][A-Z0-9_]*$", name)
            if ret:
                print("变量名:%s 符合要求... 通过正则匹配出来的数据是:%s" % (name, ret.group()))
            else:
                print("变量名:%s 不符合要求" % name)
    
    if __name__ == '__main__':
        main()
    
    邮箱正则
    import re
    
    def main():
        email = input("请输入一个邮箱地址:")
        # 如果在正则表达式中需要用到了某些普通的字符,比如. ? 等,需要在其前面加上反斜杠\ 进行转义
        ret = re.match(r"[a-zA-Z0-9_]{4,20}@(163|126)\.com$", email)
        if ret:
            print("邮箱地址 %s 符合要求" % email)
            # 若果正则里面有小括号,匹配成功,可以用group(n) 来获取括号内的内容
            print(ret.group(1))
        else:
            print("邮箱地址 %s 有误" % email)
    
    if __name__ == '__main__':
        main()
    
    匹配分组
    字符 功能
    | 匹配左右任意一个表达式
    (ab) 将括号内字符作为一个分组
    \num 引用分组num匹配到的字符串
    (?P<name>) 分组起别名
    (?P=name) 引用别名为name分组匹配到的字符串
        html_str = "<h1>hello html</h1>"
        result = re.match(r"<(\w*)>.*</\1>", html_str)
        print(result.group())
    
        html_str = "<body><h1>hello html</h1></body>"
    
        result = re.match(r"<(\w*)><(\w*)>.*</\2></\1>", html_str)
        print(result.group())
    
        result = re.match(r"<(?P<p1>\w*)><(?P<p2>\w*)>.*</(?P=p2)></(?P=p1)>", html_str)
        print(result.group())
    
    re的高级用法

    search、findall、 sub、 split

    import re
    
    
    def add(temp):
        strnun = temp.group()
        num = int(strnun) + 1
        return str(num)
    
    # 匹配出文章阅读的次数 search 不需要从头开始找,找到就返回
    ret = re.search(r"\d+", "阅读次数为 9999")
    print(ret.group())
    
    # 统计出python、c、c++相应文章阅读的次数 findall 不需要从头开始找,找到返回,然后有接着找,直到结束
    ret = re.findall(r"\d", "python = 9999, c = 7890, c++ = 12345")
    print(ret)
    
    # 首先正则去匹配,找到并替换后返回整个字符串
    ret = re.sub(r"\d+", "998", "python = 997")
    print(ret)
    
    # sub 可以使用函数
    ret = re.sub(r"\d+", add, "python = 999")
    print(ret)
    
    # splt 根据匹配进行切割字符串,并返回一个列表
    ret = re.split(r":| ", "info:xiaozhang 33 shangdong")
    print(ret)
    

    相关文章

      网友评论

          本文标题:03-web服务器v3.1--01

          本文链接:https://www.haomeiwen.com/subject/gnjbxqtx.html