I Found You! 正则表达式!

作者: 伯恩的遗产 | 来源:发表于2015-04-05 15:16 被阅读3833次

    一、正则表达式的作用:

    • 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”)

    • 可以通过正则表达式,从字符串中获取我们想要的特定部分(内容和范围)

    二、初窥正则表达式:

    问题:判断一个字符串中是否包含字母

    • 在使用正则表达式之前,我们是这么做的:

      NSString *string = @"5347858h7";
          
      BOOL flag = YES;
      for (int i = 0; i<string.length; i++) {
         unichar c = [string characterAtIndex:i];
         if (!(c >= '0' && c <= '9')) {
             flag = NO;
             break;
         }
      }
          
      if (flag) {
         NSLog(@"不包含字母");
      } else {
         NSLog(@"包含了字母");
      }
      
    • 自从有了正则表达式,我们是这么做的:

      NSString *string = @"5347858h7";
      
      NSString *pattern = @"[a-zA-Z]";
      NSRegularExpression *regex = [[NSRegularExpression alloc] initWithPattern:pattern options:0 error:nil];
      
      NSArray *results = [regex matchesInString:string options:0 range:NSMakeRange(0, string.length)];
      
      if (results.count = 0) {
         NSLog(@"不包含字母");
      } else {
         NSLog(@"包含了字母");
      }
      

    很好很强大,世界如此美妙!

    三、OC中正则表达式的使用步骤:

    1. 编写正则表达式的样式:

      NSString *string = @"5347858h7";    
      
    2. 初始化正则表达式:

      NSRegularExpression *regex = [[NSRegularExpression alloc] initWithPattern:pattern options:0 error:nil];        
      
    3. 匹配字符串并返回结果:

      NSArray *results = [regex matchesInString:string options:0 range:NSMakeRange(0, string.length)];              
      
    4. 输出结果:

      for (NSTextCheckingResult *result in results) {
          NSLog(@"范围:%@ 结果:%@", NSStringFromRange(result.range), [string substringWithRange:result.range]);
      }         
      

    四、正则表达式语法:

    正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”)。模式描述在搜索文本时要匹配的一个或多个字符串。

    1.示例

    表达式 说明
    /^\s*$/ 匹配空行
    /\d{2}-\d{5}/ 验证由两位数字、一个连字符再加 5 位数字组成的 ID 号
    /<\s(\S+)(\s[^>])?>[\s\S]<\s/\1\s*>/ 匹配 HTML 标记

    2.常用字符以及他们的作用

    • 元字符
    字符 说明
    . 匹配除换行符以外的任意字符
    \s 匹配任意的空白符
    \w 匹配字母或数字或下划线或汉字
    \d 匹配数字
    \b 匹配单词的开始或结束
    ^ 匹配字符串的开始
    $ 匹配字符串的结束
    • 重复
    字符 说明
    * 重复零次或更多次
    + 重复一次或更多次
    重复零次或一次
    {n} 重复n次
    {n,} 重复n次或更多次
    {n,m} 重复n到m次
    • 字符
    字符 说明
    [] 在某个位置匹配方括号里的任意一个字符
    [a-z] 在某个位置匹配某个范围的字符
    按位或字符 分支,即“或者”
    () 括号,用于分组,括号中属于一个整体
    • 反义字符
    字符 说明
    \S 匹配任意不是空白符的字符
    \W 匹配任意不是字母,数字,下划线,汉字的字符
    \D 匹配任意非数字的字符
    \B 匹配不是单词开头或结束的位置
    [^a] 匹配除了a以外的任意字符
    [^abcdef] 匹配除了abcdef这几个字母以外的任意字符
    • 贪婪与懒惰

      • 贪婪:

      当正则表达式中包含能接受重复的限定符时,默认是匹配尽可能多的字符。
      例如:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。

    • 懒惰:

      懒惰匹配,也就是匹配尽可能少的字符。只要在重复字符后面加上一个问号‘?’,就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。
      例如:a.*?b,它将匹配最短的以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab(第一到第三个字符)和ab(第四到第五个字符)。

    声明

    1. 以上内容属于本人整理的笔记,如有错误的地方希望能告诉我,大家共同进步。

    2. 以上内容有些段落或语句可能是本人从其他地方Copy而来,如有侵权,请及时告诉我。

    相关文章

      网友评论

      本文标题:I Found You! 正则表达式!

      本文链接:https://www.haomeiwen.com/subject/vknaxttx.html