十二个字符在正则表达式中具有特殊含义:
反斜杠\,插入符号^,美元符号$,句点或小圆点.,竖线或管道符号| ,问号?,星号或星*,加号+,左圆括号(,右圆括号),左方括号[ 和 左花括号{。
当单独使用时,大部分是错误的。
如果您想在正则表达式中使用这些字符中的任何一个作为文字,您需要使用反斜杠对它们进行转义。
如果要匹配1+1=2,正确的正则表达式是1\+1=2。否则,加号就有特殊的意义。
不可打印字符
可以使用特殊字符序列在正则表达式中放置不可打印字符。使用\t匹配制表符(ASCII 0x09), \r匹配回车符(0x0D),
\n匹配换行符(0x0A)。
比较奇特的非打印对象有\a (bell, 0x07)、\e (escape, 0x1B)、\f (form feed换页, 0x0C)和\v (vertical tab垂直制表符,0x0B)。
请记住,Windows文本文件使用\ r \ n结束行,也就是换行。而UNIX文本文件使用\ n。
如果您的应用程序支持Unicode,请使用\uFFFF或\x{FFFF}插入Unicode字符。\u20AC或\x{20AC}匹配欧元货币符号。
如果应用程序不支持Unicode,可以使用\xFF通过字符集中的十六进制索引匹配特定字符。\xA9匹配Latin-1字符集中的版权符号。
网友评论