正则表达式

作者: 德坤丨 | 来源:发表于2016-07-29 20:13 被阅读47次

    今天在学习python爬虫爬取妹子图,需要用到正则表达式。感觉一头雾水,于是谷歌了一篇关于讲解正则表达式入门

    这篇文章简洁明了,照着敲代码解决了今天的爬取的难题。正则表达式基础部分主要需要用到三部分  元字符

    . 匹配除换行符以外的任意字符

    \w 匹配字母或数字或下划线或汉字

    \s 匹配任意的空白符

    \d 匹配数字

    \b 匹配单词的开始或结束

    ^ 匹配字符串的开始

    $ 匹配字符串的结束   


    第二部分就是由常用二限定符来组成了,大体包括以下几个

    * 重复零次或更多次

    + 重复一次或更多次

    ? 重复零次或一次

    {n} 重复n次

    {n,} 重复n次或更多次

    {n,m} 重复n到m次


    第三部分就是由常用反义代码来组成了

    \W 匹配任意不是字母,数字,下划线,汉字的字符

    \S 匹配任意不是空白符的字符

    \D 匹配任意非数字的字符

    \B 匹配不是单词开头或结束的位置

    [^x] 匹配除了x以外的任意字符

    [^aeiou] 匹配除了aeiou这几个字母以外的任意字符


    个人认为学习正则表达式,只要记住这些常用的就足够了,遇到基础无法解决的,就借助搜索引擎再配合基础部分就可以匹配出来了,主要还是熟能生巧!

    相关文章

      网友评论

      本文标题:正则表达式

      本文链接:https://www.haomeiwen.com/subject/dwbzjttx.html