美文网首页爬虫专辑
常用正则表达式

常用正则表达式

作者: iOS_ITCode | 来源:发表于2017-03-23 11:34 被阅读0次

    组成

    普通字符

    普通字符包括没有显式指定为元字符的所有可打印和不可打印字符。这包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。

    直接量字符

    非打印字符是正则表达式的组成部分。下表列出了表示非打印字符的转义序列:

    '\f'   # 匹配一个换页符。等价于 \x0c 和 \cL。
    '\n'   # 匹配一个换行符。等价于 \x0a 和 \cJ。
    '\r'   # 匹配一个回车符。等价于 \x0d 和 \cM。
    '\t'   # 匹配一个制表符。等价于 \x09 和 \cI。
    '\v'   # 匹配一个垂直制表符。等价于 \x0b 和 \cK。
    '\s'   # 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
    '\S'   # 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
    '\XXX' # 由十进制数 XXX 指定的ASCII码字符
    '\Xnn' # 由十六进制数 nn 指定的ASCII码字符
    '\cX'  # 匹配由x指明的控制字符。*例如, \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 'c' 字符。*
    '\c'
    \cX  # ^X
    \cM  # Control-M 或回车符
    \cI  # \t
    \cJ  # \n
    

    特殊字符

    所谓特殊字符,就是一些有特殊含义的字符,如上面说的'.txt'中的'',简单的说就是表示任何字符串的意思。如果要查找文件名中有''的文件,则需要对''进行转义,即在其前加一个''。许多元字符要求在试图匹配它们时特别对待。若要匹配这些特殊字符,必须首先使字符"转义",即,将反斜杠''放在它们前面。下表列出了正则表达式中的特殊字符:

    '$'     # 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 '\n' 或 '\r'。要匹配 $ 字符本身,请使用 \$。
    '(' ')' # 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符,请使用 \( 和 \)。
    '*'     # 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 \*。
    '+'     # 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 \+。
    '.'     # 匹配除换行符 \n 之外的任何单字符。要匹配 . ,请使用 \. 。
    '['     # 标记一个中括号表达式的开始。要匹配 [,请使用 \[。
    '?'     # 匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。要匹配 ? 字符,请使用 \?。
    '\'     # 将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如, 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\\' 匹配 "\",而 '\(' 则匹配 "("。
    '^'     # 匹配输入字符串的开始位置,除非在方括号表达式中使用,此时它表示不接受该字符集合。要匹配 ^ 字符本身,请使用 \^。
    '{'     # 标记限定符表达式的开始。要匹配 {,请使用 \{。
    '|'     # 指明两项之间的一个选择。要匹配 |,请使用 \|。
    

    限定符

    限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有'*'或'+'或'?'或'{n}'或'{n,}'或'{n,m}'共6种。

    '*'     # 匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。
    '+'     # 匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。
    '?'     # 匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等价于 {0,1}。
    '{n}'   # n 是一个非负整数。匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的两个 o。
    '{n,}'  # n 是一个非负整数。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
    '{n,m}' # m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。
    

    定位符

    定位符使您能够将正则表达式固定到行首或行尾。它们还使您能够创建这样的正则表达式,这些正则表达式出现在一个单词内、在一个单词的开头或者一个单词的结尾。
    定位符用来描述字符串或单词的边界,^和$分别指字符串的开始与结束,\b描述单词的前或后边界,\B表示非单词边界。

    '^'  # 匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与 \n 或 \r 之后的位置匹配。
    '$'  # 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与 \n 或 \r 之前的位置匹配。
    '\b' # 匹配一个字边界,即字与空格间的位置。
    '\B' # 非字边界匹配。
    

    字符类

    将单独的直接符放进中括号内就可以组合成字符类.一个字符类和它所包含的任何一个字符都匹配,所以正则表达式 / [abc] / 和字母 "a" , "b" , "c" 中的任何一个都匹配.另外还可以定义否定字符类,这些类匹配的是除那些包含在中括号之内的字符外的所有字符.定义否定字符尖时,要将一个 ^ 符号作为从左中括号算起的第一个字符.正则表达式的集合是 / [a-zA-z0-9] / .
    由于某些字符类非常常用,所以JavaScript的正则表达式语法包含一些特殊字符和转义序列来表示这些常用的类.例如, \s 匹配的是空格符,制表符和其它空白符, \s匹配的则是空白符之外的任何字符.

    正则表灰式的字符类

    字符匹配

    [...] 位于括号之内的任意字符
    [^...] 不在括号之中的任意字符
    . 除了换行符之外的任意字符,等价于[^\n]
    \w 任何单字字符, 等价于[a-zA-Z0-9]
    \W 任何非单字字符,等价于[^a-zA-Z0-9]
    \s 任何空白符,等价于[\ t \ n \ r \ f \ v]
    \S 任何非空白符,等价于[^\ t \ n \ r \ f \ v]
    \d 任何数字,等价于[0-9]
    \D 除了数字之外的任何字符,等价于[^0-9]
    [\b] 一个退格直接量(特例)
    

    复制

    用以上的正则表式的语法,可以把两位数描述成 / \ d \ d /,把四位数描述成 / \d \ d \ d \ d /.但我们还没有一种方法可以用来描述具有任意多数位的数字或者是一个
    字符串.这个串由三个字符以及跟随在字母之后的一位数字构成.这些复杂的模式使用的正则表达式语法指定了该表达式中每个元素要重复出现的次数.
    指定复制的字符总是出现在它们所作用的模式后面.由于某种复制类型相当常用.所以有一些特殊的字符专门用于表示它们.例如: +号匹配的就是复制前一模式一次或多次的模式.下面的表列出了复制语法.先看一个例子:

    /\d{2, 4}/ //匹配2到4间的数字.
    /\w{3} \d?/ //匹配三个单字字符和一个任意的数字.
    /\s+java\s+/ //匹配字符串"java" ,并且该串前后可以有一个或多个空格.
    /[^"] * / //匹配零个或多个非引号字符.
    

    正则表达式的复制字符的含义

    {n, m} 匹配前一项至少n次,但是不能超过m次
    {n, } 匹配前一项n次,或者多次
    {n} 匹配前一项恰好n次
    ? 匹配前一项0次或1次,也就是说前一项是可选的. 等价于 {0, 1}
    + 匹配前一项1次或多次,等价于{1,}
    * 匹配前一项0次或多次.等价于{0,}
    

    选择,分组和引用

    正则表达式的语法还包括指定选择项,对子表达式分组和引用前一子表达式的特殊字符.字符| 用于分隔供选择的字符.例如: /ab|cd|ef/ 匹配的是字符串 "ab",或者是字符串 "cd",又或者 "ef". /\d{3}|[a-z]{4}/ 匹配的是要么是一个三位数,要么是四个小写字母.在正则表达式中括号具有几种作用.它的主要作用是把单独的项目分组成子表达式,以便可以像处理一个独立的单元那种用 *、+或? 来处理那些项目.例如: /java(script) ?/ 匹配的是字符串 "java",其后既可以有 "script",也可以没有. /(ab|cd) + |ef) / 匹配的既可以是字符串 "ef",也可以是字符串"ab" 或者 "cd" 的一次或多次重复.
    在正则表达式中,括号的第二个用途是在完整的模式中定义子模式。当一个正则表达式成功地和目标字符串相匹配时,可以从目标串中抽出和括号中的子模式相匹配的部分.例如,假定我们正在检索的模式是一个或多个字母后面跟随一位或多位数字,那么我们可以使用模式 / [a-z] + \ d+/.但是由于假定我们真正关心的是每个匹配尾部的数字,那么如果我们将模式的数字部分放在括号中 (/ [a-z] + (\d+)/) ,我们就可以从所检索到的任何匹配中抽取数字了,之后我们会对此进行解析的.
    代括号的子表达式的另一个用途是,允许我们在同一正则表达式的后面引用前面的子表达式.这是通过在字符串 \ 后加一位或多位数字来实现的.数字指的是代括号的子表达式在正则表达式中的位置.例如: \1 引用的是第一个代括号的子表达式. \3 引用的是第三个代括号的子表达式.注意,由于子表达式可以嵌套在其它子表达式中,所以它的位置是被计数的左括号的位置.
    例如:在下面的正则表达式被指定为 \2:

    /([Jj]ava([Ss]cript)) \sis \s (fun\w*) /
    对正则表达式中前一子表达式的引用所指定的并不是那个子表达式的模式,而是与那个模式相匹配的文本.这样,引用就不只是帮助你输入正则表达式的重复部分的快捷方式了,它还实施了一条规约,那就是一个字符串各个分离的部分包含的是完全相同的字符.例如:下面的正则表达式匹配的就是位于单引号或双引号之内的所有字符.但是,它要求开始和结束的引号匹配(例如两个都是双引号或者都是单引号):
    /[' "] [^=XXFN}[' "]/
    如果要求开始和结束的引号匹配,我们可以使用如下的引用:
    /( [' "] ) {FNXX=] \1/
    \1匹配的是第一个代括号的子表达式所匹配的模式.在这个例子中,它实施了一种规约,那就是开始的引号必须和结束的引号相匹配.注意,如果反斜杠后跟随的数字比代括号的子表达式数多,那么它就会被解析为一个十进制的转义序列,而不是一个引用.你可以坚持使用完整的三个字符来表示转义序列,这们就可以避免混淆了.例如,使用 \044,而不是\44.下面是正则表达式的选择、分组和引用字符:
    

    字符含义

    | 选择.匹配的要么是该符号左边的子表达式,要么它右边的子表达式
    (...) 分组.将几个项目分为一个单元.这个单元可由 *、+、?和|等符号使用,而且还可以记住和这个组匹配的字符以供此后引用使用
    \n 和第n个分组所匹配的字符相匹配.分组是括号中的子表达式(可能是嵌套的).分组号是从左到右计数的左括号数
    

    指定匹配的位置

    我们已经看到了,一个正则表达式中的许多元素才能够匹配字符串的一个字符.例如: \s 匹配的只是一个空白符.还有一些正则表达式的元素匹配的是字符之间宽度为0的空间,而不是实际的字符例如: \b 匹配的是一个词语的边界,也就是处于一个/w字字符和一个\w非字字符之间的边界.像\b 这样的字符并不指定任何一个匹配了的字符串中的字符,它们指定的是匹配所发生的合法位置.有时我们称这些元素为正则表达式的锚.因为它们将模式定位在检索字符串中的一个特定位置.最常用的锚元素是 ^, 它使模式依赖于字符串的开头,而锚元素$则使模式定位在字符串的末尾.
    例如:要匹配词 "javascript" ,我们可以使用正则表达式 /^ javascript $/. 如果我们想检索 "java" 这个词自身 (不像在 "javascript" 中那样作为前缀),那么我们可以使用模式 /\s java \s /, 它要求在词语java之前和之后都有空格.但是这样作有两个问题.第一: 如果 "java" 出现在一个字符的开头或者是结尾.该模式就不会与之匹配,除非在开头和结尾处有一个空格. 第二: 当这个模式找到一个与之匹配的字符时,它返回的匹配的字符串前端和后端都有空格,这并不是我们想要的.因此,我们使用词语的边界 \b 来代替真正的空格符 \s 进行匹配. 结果表达式是 /\b java \b/.
    下面是正则表达式的锚字符:

    字符含义

    ^ 匹配的是字符的开头,在多行检索中,匹配的是一行的开头
    $ 匹配的是字符的结尾,在多行检索中,匹配的是一行的结尾
    \b 匹配的是一个词语的边界.简而言之就是位于字符\w 和 \w之间的位置(注意:[\b]匹配的是退格符)
    \B 匹配的是非词语的边界的字符
    

    属性

    有关正则表达式的语法还有最后一个元素,那就是正则表达式的属性,它说明的是高级模式匹配的规则.和其它正则表达式语法不同,属性是在 / 符号之外说明的.即它们不出现在两个斜杠之间,而是位于第二个斜杠之后.javascript 1.2支持两个属性.属性 i 说明模式匹配应该是大小写不敏感的.属性 g 说明模式匹配应该是全局的.也就是说,应该找出被检索的字符串中所有的匹配.这两种属性联合起来就可以执行一个全局的,大小写不敏感的匹配.

    例如: 要执行一个大小不敏感的检索以找到词语 "java" (或者是 "java" 、"JAVA"等) 的第一个具体值,我们可以使用大小不敏感的正则表达式 /\b java\b/i .如果要在一个字符串中找到 "java" 所有的具体值,我们还可以添加属性 g, 即 /\b java \b/gi .
    

    以下是正则表达式的属性:

    字符含义

    i 执行大小写不敏感的匹配

    g 执行一个全局的匹配,简而言之,就是找到所有的匹配,而不是在找到第一个之后就停止了
    除属性 g 和 i 之外,正则表达式就没有其它像属性一样的特性了.如果将构造函数 RegExp 的静态属性 multiline 设置为 tr ,那么模式匹配将以多行的模式进行.在这种模式下,锚字符 ^ 和 $ 匹配的不只是检索字符串的开头和结尾,还匹配检索字符串内部的一行的开头和结尾.

    例如: 模式 /Java$/ 匹配的是 "Java",但是并不匹配"Java\nis fun" .如果我们设置了 multiline 属性,那么后者也将被匹配:
    RegExp.multiline = tr;
    正则表达式(regular expression)对象包含一个正则表达式模式(pattern)。它具有用正则表达式模式去匹配或代替一个串(string)中特定字符(或字符集合)的属性(properties)和方法(methods)。要为一个单独的正则表达式添加属性,可以使用正则表达式构造函数(constr tor function),无论何时被调用的预设置的正则表达式拥有静态的属性(the predefined RegExp object has static properties that are set whenever any regular expression is used, 我不知道我翻得对不对,将原文列出,请自行翻译)。
    

    创建:

    一个文本格式或正则表达式构造函数

    文本格式: /pattern/flags
    正则表达式构造函数: new RegExp("pattern"[,"flags"]);
    

    参数说明:

    pattern -- 一个正则表达式文本
    flags -- 如果存在,将是以下值:
    g: 全局匹配
    i: 忽略大小写
    gi: 以上组合
    [注意] 文本格式的参数不用引号,而在用构造函数时的参数需要引号。如:/ab+c/i new RegExp("ab+c","i")是实现一样的功能。在构造函数中,一些特殊字符需要进行转意(在特殊字符前加"\")。如:re = new RegExp("[url=file://\\w]\\w[/url]+")
    正则表达式中的特殊字符
    字符含意
    \ 做为转意,即通常在"\"后面的字符不按原来意义解释,如/b/匹配字符"b",当b前面加了反斜杆后/\b/,转意为匹配一个单词的边界。
    -或-
    对正则表达式功能字符的还原,如"*"匹配它前面元字符0次或多次,/a*/将匹配a,aa,aaa,加了"\"后,/a\*/将只匹配"a*"。
    ^ 匹配一个输入或一行的开头,/^a/匹配"an A",而不匹配"An a"
    $ 匹配一个输入或一行的结尾,/a$/匹配"An a",而不匹配"an A"
    * 匹配前面元字符0次或多次,/ba*/将匹配b,ba,baa,baaa
    + 匹配前面元字符1次或多次,/ba*/将匹配ba,baa,baaa
    ? 匹配前面元字符0次或1次,/ba*/将匹配b,ba
    (x) 匹配x保存x在名为$1...$9的变量中
    x|y 匹配x或y
    {n} 精确匹配n次
    {n,} 匹配n次以上
    {n,m} 匹配n-m次
    [xyz] 字符集(character set),匹配这个集合中的任一一个字符(或元字符)
    [^xyz] 不匹配这个集合中的任何一个字符
    [\b] 匹配一个退格符
    \b 匹配一个单词的边界
    \B 匹配一个单词的非边界
    \cX 这儿,X是一个控制符,/\cM/匹配Ctrl-M
    \d 匹配一个字数字符,/\d/ = /[0-9]/
    \D 匹配一个非字数字符,/\D/ = /[^0-9]/
    \n 匹配一个换行符
    \r 匹配一个回车符
    \s 匹配一个空白字符,包括\n,\r,\f,\t,\v等
    \S 匹配一个非空白字符,等于/[^\n\f\r\t\v]/
    \t 匹配一个制表符
    \v 匹配一个重直制表符
    \w 匹配一个可以组成单词的字符(alphanumeric,这是我的意译,含数字),包括下划线,如[\w]匹配"$5.98"中的5,等于[a-zA-Z0-9]
    \W 匹配一个不可以组成单词的字符,如[\W]匹配"$5.98"中的$,等于[^a-zA-Z0-9]。
    

    正则表达式对象的属性及方法

    预定义的正则表达式拥有有以下静态属性:input, multiline, lastMatch, lastParen, leftContext, rightContext和$1到$9。其中input和multiline可以预设置。其他属性的值在执行过exec或test方法后被根据不同条件赋以不同的值。许多属性同时拥有长和短(perl风格)的两个名字,并且,这两个名字指向同一个值。(JavaScript模拟perl的正则表达式)

    正则表达式对象的属性属性含义

    $1...$9 如果它(们)存在,是匹配到的子串
    $_ 参见input
    $* 参见multiline
    $& 参见lastMatch
    $+ 参见lastParen
    $` 参见leftContext
    $’  参见rightContext
    constr tor创建一个对象的一个特殊的函数原型
    global是否在整个串中匹配(bool型)
    ignoreCase匹配时是否忽略大小写(bool型)
    input被匹配的串
    lastIndex最后一次匹配的索引
    lastParen最后一个括号括起来的子串
    leftContext最近一次匹配以左的子串
    multiline是否进行多行匹配(bool型)
    prototype允许附加属性给对象
    rightContext最近一次匹配以右的子串
    source正则表达式模式
    lastIndex最后一次匹配的索引
    

    正则表达式对象的方法

    方法含义

    compile正则表达式比较
    exec执行查找
    test进行匹配
    toSource返回特定对象的定义(literal representing),其值可用来创建一个新的对象。重载Object.toSource方法得到的。
    toString返回特定对象的串。重载Object.toString方法得到的。
    valOf返回特定对象的原始值。重载Object.valOf方法得到
    

    常用匹配

    "^-[0-9]*[1-9][0-9]*$"                              //负整数  
    "^-?\\d+$"                                          //整数  
    "^\\d+([url=file://\\.\\d+)?$]\\.\\d+)?$[/url]"     //非负浮点数(正浮点数 + 0)  
    "^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$" //正浮点数  
    "^((-\\d+([url=file://\\.\\d+)?)|(0+(\\.0+)?))$]\\.\\d+)?)|(0+(\\.0+)?))$[/url]" //非正浮点数(负浮点数 + 0)  
    "^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$" //负浮点数  
    "^(-?\\d+)([url=file://\\.\\d+)?$]\\.\\d+)?$[/url]"  //浮点数  
    "^[A-Za-z]+$"                                        //由26个英文字母组成的字符串  
    "^[A-Z]+$"                                           //由26个英文字母的大写组成的字符串  
    "^[a-z]+$"                                           //由26个英文字母的小写组成的字符串  
    "^[A-Za-z0-9]+$"                                     //由数字和26个英文字母组成的字符串  
    "^\\w+$"                                             //由数字、26个英文字母或者下划线组成的字符串  
    "^[\\w-]+([url=file://\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+$]\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+$[/url]" //email地址  
    "^[a-zA-z]+://([url=file://\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$]\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$[/url]" //url
    

    应用实例

    // 用户名:
    "/^[a-zA-Z]{1}([a-zA-Z0-9]|[_]){4,19}$/"
    // 无符号字符串:
    "/^[^\s]{1}[^-_\~!@#\$%\^&\*\.\(\)\[\]\{\}<>\?\\\/\'\"]*$/"
    // Email:
    "/^\w+([-+.]\w+)*@\w+([-.]\\w+)*\.\w+([-.]\w+)*$/"
    // 电话号码:
    "/^((\(\d{3}\))|(\d{3}\-))?(\(0\d{2,3}\)|0\d{2,3}-)?[1-9]\d{6,7}$/"
    // 手机号码:
    "/^((\(\d{3}\))|(\d{3}\-))?13\d{9}$/"
    // URL:
    "/^http:\/\/[A-Za-z0-9]+\.[A-Za-z0-9]+[\/=\?%\-&_~`@[\]\':+!]*([^<>\"\"])*$/"
    // 身份证:
    "/^\d{15}(\d{2}[A-Za-z0-9])?$/"
    // 货币:
    "/^\d+(\.\d+)?$/"
    // 货币:
    "/^\-\d+(\.\d+)*?$/"
    // 数字:
    "/^\d+$/"
    // 邮政编码:
    "/^[1-9]\d{5}$/"
    // QQ:
    "/^[1-9]\d{4,8}$/"
    // 整数:
    "/^[-\+]?\d+$/"
    // 实数:
    "/^[-\+]?\d+(\.\d+)?$/"
    // 英文:
    "/^[A-Za-z]+$/"
    // 中文
    "/^[\Α-\¥]+$/"
    // 密码(必须含有大写字母、小写字母、标点、数字中的至少两种。呵呵,这个比较变态吧~)
    "/^(([A-Z]*|[a-z]*|\d*|[-_\~!@#\$%\^&\*\.\(\)\[\]\{\}<>\?\\\/\'\"]*)|.{0,5})$|\s/"
    

    利用正则表达式限制网页表单里的文本框输入内容:

    <!-- 用正则表达式限制只能输入数字和英文 -->
    <input onkeyup="value=value.replace(/[/W]/g,'')" 
    onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/d]/g,''))"id="text1" name="text1"> )"
    <!-- 用正则表达式限制只能输入数字 -->
    <input onkeyup="value=value.replace(/[^/d]/g,'') " 
    onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/d]/g,''))"id="text2" name="text2"> 
    <!-- 用正则表达式限制只能输入全角字符 -->
    <input onkeyup="value=value.replace(/[^/uFF00-/uFFFF]/g,'')" 
    onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/uFF00-/uFFFF]/g,''))" 
    id="text3" name="text3"> 
    <!-- 用正则表达式限制只能输入中文 -->
    <input onkeyup="value=value.replace(/[^/u4E00-/u9FA5]/g,'')" 
    onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/u4E00-/u9FA5]/g,''))" 
    id="text4" name="text4">
    

    JavaScript中的正则表达式解析

    <script lang ge="java script">
    //去左空格;
    function ltrim(s){
         return s.replace( /^\\s*/, "");
    }
    //去右空格;
    function rtrim(s){
         return s.replace( /\\s*$/, "");
    }
    //去左右空格;
    function trim(s){
         return rtrim(ltrim(s));
    }
    //是否为空值;
    function IsEmpty(_str){
         var tmp_str = trim(_str);
         return tmp_str.length == 0;
    }
    //是否有效的Email;
    function IsMail(_str){
         var tmp_str = trim(_str);
         var pattern = /^[_a-z0-9-]+(.[_a-z0-9-]+)*@[a-z0-9-]+(.[a-z0-9-]+)*$/;
         return pattern.test(tmp_str);
    }
    HTML代码的屏蔽
    function mask_HTMLCode(strInput) {
       var myReg = /<(\w+)>/;
       return strInput.replace(myReg, "<$1>");
    }
    /*验证是否是中文*/
           function IsChinese(str)
            {
              var pattern=/^[\?-\龥]+$/;
              if(!pattern.test(str))
               {return false;}
                 return tr;
               }
    //是否有效的数字;
    function IsNumber(_str){
         var tmp_str = trim(_str);
         var pattern = /^[0-9]/;
         return pattern.test(tmp_str);
    }
    //是否有效的颜色值;
    function IsColor(color){
         var temp=color;
         if (temp=="") return tr;
         if (temp.length!=7) return false;
         return (temp.search(/\\#[a-fA-F0-9]{6}/) != -1);
    }
    //是否有效的链接;
    function IsURL(url){
         var sTemp;
         var b=tr;
         sTemp=url.s string(0,7);
         sTemp=sTemp.toUpperCase();
         if ((sTemp!="http://") target="_blank"   ... #124;|(url.length<10)){
             b=false;
         }
         return b;
    }
    //是否有效的手机号码;
    function IsMobile(_str){
         var tmp_str = trim(_str);
         var pattern = /13\\d{9}/;
         return pattern.test(tmp_str);
    }
    </script>
    

    正则表达式是一个描述字符模式的对象。
    JavaScript的RegExp对象和String对象定义了使用正则表达式来执行强大的模式匹配和文本检索与替换函数的方法.
    在JavaScript中,正则表达式是由一个RegExp对象表示的.当然,可以使用一个RegExp()构造函数来创建RegExp对象,也可以用JavaScript 1.2中的新添加的一个特殊语法来创建RegExp对象.就像字符串直接量被定义为包含在引号内的字符一样,正则表达式直接量也被定义为包含在一对斜杠(/)之间的字符.所以,JavaScript可能会包含如下的代码:
    var pattern = /s$/;
    这行代码创建一个新的RegExp对象,并将它赋给变量parttern.这个特殊的RegExp对象和所有以字母"s"结尾的字符串都匹配.用RegExp()也可以定义一个等价的正则表达式,代码如下:
    var pattern = new RegExp("s$");
    无论是用正则表达式直接量还是用构造函数RegExp(),创建一个RegExp对象都是比较容易的.较为困难的任务是用正则表达式语法来描述字符的模式.JavaScript采用的是Perl语言正则表达式语法的一个相当完整的子集.
    正则表达式的模式规范是由一系列字符构成的.大多数字符(包括所有字母数字字符)描述的都是按照字面意思进行匹配的字符.这样说来,正则表达式/java/就和所有包含子串 "java" 的字符串相匹配.虽然正则表达式中的其它字符不是按照字面意思进行匹配的,但它们都具有特殊的意义.正则表达式 /s$/ 包含两个字符.
    第一个特殊字符 "s" 是按照字面意思与自身相匹配.第二个字符 "$" 是一个特殊字符,它所匹配的是字符串的结尾.所以正则表达式 /s$/ 匹配的就是以字母 "s" 结尾
    的字符串

    相关文章

      网友评论

        本文标题:常用正则表达式

        本文链接:https://www.haomeiwen.com/subject/hlsznttx.html