正则表达式库
import re
常用符号
. : 匹配任意字符(一个‘.’ 代表一个占位符,单独使用不包括换行符‘\n’)
* : 匹配前一个字符0次或无限次
? : 匹配前一个字符0次或一次
.* :贪心算法
.*?:非贪心算法
() : 括号里面的值作为返回结果
常用方法
findall():匹配所有符合规律的内容,返回包含结果的列表
search(): 匹配并提取第一个符合规律的内容,返回一个正则表达式对象(object)
sub(): 替换符合规律的内容,返回替换后的值
re.S 的功能
使 '.' 能匹配新的一行 包括\n 换行符
匹配纯数字
re.findall('(\d+)',str)
利用正则实现翻页功能
old_url = http://www.string.com/course/?pageNum=2
new_link = re.sub('pageNum=\d+','pageNum=%d'%i,old_url)
网友评论