美文网首页
python.正则表达式.1

python.正则表达式.1

作者: happyfatboy | 来源:发表于2018-09-10 19:58 被阅读0次

    import re  markdown

    1、在规则中可以用.来匹配包括换行在内的所有字符

    2、在r规则中,^表示匹配开头位置

    3、当字符串有多行时,在re.findall(r,s,re.M),大M表示多行

    4、当正则的规则有多行(/d)时,要在表达式中加入大S,re.findall(r,s,re.S)

    5、在正则规则中,小括号可以帮助两个存在或关系的元素分组,(\.com|\.cn),findall会优先返回小括号中的分组数据

    6、可以用小括号标志来查找固定目的的东西:

    r = r" net1  ip = ( .+)",就能返回后面的IP地址,.表示任意字符,+表示大于等于1个

    爬虫

    1、网址源代码中的图片其实都是一个网络地址,http开通,.jpg结尾的那种,可以用正则表达式筛选

    2、import urllib是一个获取url网页地址的模块,urllib.open(url),将他赋值给page,然后page.read()读取地址,return读取后的地址中的数据

    3、匹配页面图片,r = r"src =  “.+ \.jpg" width" ,之后对正则进行编译,bianyi = re.compile(r), 然后将找出来的结果赋值给一个变量jieguo = re.findall(bianyi,yuandizhi)

    4、urllib.urlretrieve(x,' 123.jpg')可以下载括号中地址x所对应的元素,此处可以用'%s.jpg' % x    x +=1 '来给每个图片按顺序命名

    相关文章

      网友评论

          本文标题:python.正则表达式.1

          本文链接:https://www.haomeiwen.com/subject/rnlegftx.html