正则表达式在程序编码中的应用
正则表达式(括号)、[中括号]、{大括号}的区别小结
正则表达式的() [] {}有不同的意思。
() 是为了提取匹配的字符串。表达式中有几个()就有几个相应的匹配字符串。
(\s*)表示连续空格的字符串。
[]是定义匹配的字符范围。比如 [a-zA-Z0-9] 表示相应位置的字符要匹配英文字符和数字。[\s]表示空格或者号。
{}一般用来表示匹配的长度,比如 \s{3} 表示匹配三个空格,\s{1,3}表示匹配一到三个空格。
(0-9) 匹配 '0-9′ 本身。 [0-9]* 匹配数字(注意后面有 *,可以为空)[0-9]+ 匹配数字(注意后面有 +,不可以为空){1-9} 写法错误。
[0-9]{0,9} 表示长度为 0 到 9 的数字字符串。
————————————————————————————————————————————————————————————
圆括号()是组,主要应用在限制多选结构的范围/分组/捕获文本/环视/特殊模式处理
示例:
1、(abc|bcd|cde),表示这一段是abc、bcd、cde三者之一均可,顺序也必须一致
2、(abc)?,表示这一组要么一起出现,要么不出现,出现则按此组内的顺序出现
3、(?:abc)表示找到这样abc这样一组,但不记录,不保存到x取第几个括号所匹配到的项,比如:(aaa)(bbb)(ccc)(?:ddd)(eee),可以用3则获取到了(ccc)匹配到的内容,而$4则获取的是由(eee)匹配到的内容,因为前一对括号没有保存变量
4、a(?=bbb) 顺序环视 表示a后面必须紧跟3个连续的b
5、(?i:xxxx) 不区分大小写 (?s:.*) 跨行匹配.可以匹配回车符
方括号是单个匹配,字符集/排除字符集/命名字符集
示例:
1、[0-3],表示找到这一个位置上的字符只能是0到3这四个数字,与(abc|bcd|cde)的作用比较类似,但圆括号可以匹配多个连续的字符,而一对方括号只能匹配单个字符
2、[^0-3],表示找到这一个位置上的字符只能是除了0到3之外的所有字符
3、[:digit:] 0-9 [:alnum:] A-Za-z0-9
——————————————————————————————————————————————————————————————————————
()和[]有本质的区别
()内的内容表示的是一个子表达式,()本身不匹配任何东西,也不限制匹配任何东西,只是把括号内的内容作为同一个表达式来处理,例如(ab){1,3},就表示ab一起连续出现最少1次,最多3次。如果没有括号的话,ab{1,3},就表示a,后面紧跟的b出现最少1次,最多3次。另外,括号在匹配模式中也很重要。这个就不延伸了,LZ有兴趣可以自己查查
[]表示匹配的字符在[]中,并且只能出现一次,并且特殊字符写在[]会被当成普通字符来匹配。例如[(a)],会匹配(、a、)、这三个字符。
所以() [] 无论是作用还是表示的含义,都有天壤之别,没什么联系
实际代码
这里是一段使用了较多变量名的代码段,现在要为变量ox1,ox2,oy1,oy2等变量统一增加 plot_
前缀。
ox1 = 40, oy1 = 430;
ox2 = 40, oy2 = 790;
h1 = 340, h2 = 340;
POINT_COLOR = BLACK;
/* 幅值坐标轴 */
DRAW_LINE(10, oy1, 470, oy1);
DRAW_LINE(ox1, oy1 - h1, ox1, oy1);
/* 相位坐标轴 */
DRAW_LINE(10, oy2, 470, oy2);
DRAW_LINE(ox2, oy2 - h2, ox2, oy2);
使用正则中小括号规则及其捕获作用。
Pattern: (ox1|oy1|ox2|oy2|h1|h2)
Replace: plot_\1
最终得到的目标代码:
plot_ox1 = 40, plot_oy1 = 430;
plot_ox2 = 40, plot_oy2 = 790;
plot_h1 = 340, plot_h2 = 340;
POINT_COLOR = BLACK;
/* 幅值坐标轴 */
DRAW_LINE(10, plot_oy1, 470, plot_oy1);
DRAW_LINE(plot_ox1, plot_oy1 - plot_h1, plot_ox1, plot_oy1);
/* 相位坐标轴 */
DRAW_LINE(10, plot_oy2, 470, plot_oy2);
DRAW_LINE(plot_ox2, plot_oy2 - plot_h2, plot_ox2, plot_oy2);
网友评论