在处理正字符串的时候,经常会有一些复杂规则的字符串需求,
正则表表达式就是描述这些规则的公工具。
换句话说
正则表达式就是记录文本规则的代码。
正则表达式不是什么开发语言,也不什么脚本语言,但是你在做项目开发的时候,离不开它。你可以把它理解过一种逻辑公式,正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。正则对刚入门的程序员,甚至有些工作了5年以上的程序员,也不会写正则表达式,学起来没什么难度,真正写起来不知道从那上手。
为什么要分享给大家正则表达式呢,因为不论你是做web项目开发,还是app开发都离不开它,小到验证信息,像验证手机号,数字,身份证,银行卡号等,大到数据抓取,大数据方面都要用到,所以学好正则表达式是一个高级程序员必须要掌握的,今天就给大家分享一些学习资料和技巧。
第一期咱们就从最简单的说起
行定位符
行定位符就是描述字串的边界,"^"是描述行的开始;“$”是描述行的结尾。
例如:
^No
该表达式的意思就是匹配以tm为开始位置的行头,如‘Nothing is necessary.Everything is a choice’就可以匹配到。
def match_str(string):
regex_str = '^No' #匹配规则
match_regex = re.match(regex_str, string)
if match_regex:
print('match!')
else:
print('not match')
if __name__ == '__main__':
match_str('Nothing is necessary.Everything is a choice') #进行匹配的字符串
#match!
再来看一下行结尾符:
in$
这个表达式的意思就是匹配以in为结尾位置的行尾,如‘I hope you never lack the courage to start over again’就可以匹配到。
def match_str(string):
regex_str = '.*in$' #匹配规则
match_regex = re.match(regex_str, string)
if match_regex:
print('match!')
else:
print('not match')
if __name__ == '__main__':
match_str('I hope you never lack the courage to start over again') #进行匹配的字符串
#match
今天只说最简单的这两个,大佬的话绕道勿喷。新手朋友希望动手练习。明天咱们继续!
网友评论