美文网首页
NSDataDetector取代iOS的某些正则表达式:URL,

NSDataDetector取代iOS的某些正则表达式:URL,

作者: 二斤寂寞 | 来源:发表于2020-03-03 21:52 被阅读0次

一. NSDataDetector介绍

NSDataDetector 是继承于 NSRegularExpression 的一个子类。使用的时候只需要指定要匹配的类型(日期、地址、URL等)就可以提取的想要的信息,而不需要自己再写复杂的表达式。

苹果对一些常用的正则匹配都作了封装,如时间,时区,网页链接url,电话号码等等,而且这些识别是国际化的,比如中国的手机号是13044345467,XX国的手机号是932-23333222,它都可以识别.又比如中国人的名字是王大明,英国人的名字是 William Jafferson Clinton,也都能识别.
我们不用自己去写正则表达式匹配,而采用NSDataDetector.
阅读它的描述已经能获取大多数信息.

二. 使用方法:

1. 使用NSRegularExpression的方法.

作为NSRegularExpression的子类,它可使用其所有方法.numberOfMatchesInString:options:range就是其一,查看一共有多少匹配项.还有matches(in:options:range:)和firstMatch(in:options:range:)

NSString * string = @"欢迎访问http://www.111cn.net,https://111cn.net\n以及ftp://111cn.net";

NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypePhoneNumber| NSTextCheckingTypeLink  error:&error];

NSUInteger numberOfMatches = [detector numberOfMatchesInString:string
                                                           options:0
                                                             range:NSMakeRange(0, [string length])];

2. 这是matches(in:options:range:)的用法:

NSString * string = @"欢迎访问http://www.jianshu.com/users/72ee5da886ff/latest_articles. 咱的电话是012-1304445928.ps:电话随便写的哟.今天是2016-10-25,天气(weather)不错";

NSString * string = @"欢迎访问http://www.jianshu.com/users/72ee5da886ff/latest_articles. 咱的电话是012-1304445928.ps:电话随便写的哟.今天是2016-10-25,天气(weather)不错";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink|NSTextCheckingTypePhoneNumber error:&error];

NSArray *matches = [detector matchesInString:string
                                         options:0
                                           range:NSMakeRange(0, [string length])];
for (NSTextCheckingResult *match in matches) {
        NSRange matchRange = [match range];
        if ([match resultType] == NSTextCheckingTypeLink) {
            NSURL *url = [match URL];
            NSLog(@"url:%@", url);
        } else if ([match resultType] == NSTextCheckingTypePhoneNumber) {
            NSString *phoneNumber = [match phoneNumber];
            NSLog(@"phoneNumber:%@", phoneNumber);
        }
}

3.块是另一种形式,比较灵活和高效.

为何?因为它是每找到一个match,就进入块一次.
比如一共有4个match,它就会进入4次块.
所以你可以用块的参数stop控制这个块.如果你已经找到需要的match,就设置stop为YES,就不会继续找match了.

    NSString * string = @"欢迎访问http://www.jianshu.com/users/72ee5da886ff/latest_articles. 咱的电话是012-1304445928.ps:电话随便写的哟.今天是2016-10-25,天气(weather)不错";
    NSError * error = nil;
    NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink|NSTextCheckingTypePhoneNumber error:&error];

    __block NSUInteger count = 0;
    [detector enumerateMatchesInString:string options:0 range:NSMakeRange(0, [string length]) usingBlock:^(NSTextCheckingResult * _Nullable match, NSMatchingFlags flags, BOOL * _Nonnull stop) {

        NSLog(@"flag:%lu",(unsigned long)flags);
        NSRange matchRange = [match range];

        if ([match resultType] == NSTextCheckingTypeLink) {
            NSURL *url = [match URL];
            NSLog(@"url:%@", url);
        }
        if (count == 0) *stop = YES;

        if ([match resultType] == NSTextCheckingTypePhoneNumber) {
            NSString *phoneNumber = [match phoneNumber];
            NSLog(@"phoneNumber:%@", phoneNumber);
        }

    }];

三. 知识点分析

1.options参数

enumerateMatchesInString:range:usingBlock:的options参数官网demo写的是0, 它有个枚举:

  • NSMatchingReportProgress: 网上说是:找到最长的匹 配字符串后调用block回调.我实验后发现它进入了很多很多次.... so 这个枚举没搞懂
  • NSMatchingReportCompletion : 当匹配都完成后,还会进入一次block,汇报完成
  • NSMatchingAnchored : 网上说:从匹配范围的开始出进行极限匹配 .我实验后一次都没进入
  • NSMatchingWithTransparentBounds : 网上说:允许匹配的范围超出设置的范围. 实验后,正常,有几次匹配就进入几次
  • NSMatchingWithoutAnchoringBounds : 文档说:禁止^和$自动匹配开始和结束. 实验后,正常,有几次匹配就进入几次

2. NSDataDetector的checkingTypes

上面是比较常用的匹配方式,细心的孩子肯定注意到,NSDataDetector可匹配的枚举还有好多个,是否每个都可用呢?
亲身实验,发现有的不行,运行时程序会报错(no data detector types specified'),说没有这个枚举

  • NSTextCheckingTypeOrthography : 不可用
  • NSTextCheckingTypeSpelling : 不可用
  • NSTextCheckingTypeGrammar : 不可用
  • NSTextCheckingTypeDate : 可用, 用法有
if ([match resultType] == NSTextCheckingTypeDate) {
     NSDate *date = [match date];
     NSLog(@"date:%@", date);

     NSTimeZone * timezone = [match timeZone];
     NSLog(@"time zone:%@", timezone);

     CFTimeInterval duration = [match duration];
     NSLog(@"duration:%f", duration);
}

  • NSTextCheckingTypeAddress : 可用, 用法有:
  if ([match resultType] == NSTextCheckingTypeAddress) {
      NSDictionary<NSString *, NSString *> * addressComponent = [match addressComponents];
      NSLog(@"城市:%@, 街道:%@", addressComponent[NSTextCheckingCityKey], addressComponent[NSTextCheckingStreetKey]);
}

  • NSTextCheckingTypeLink : 可用 , 用法有:
 if ([match resultType] == NSTextCheckingTypeLink) {
            NSURL *url = [match URL];
            NSLog(@"url:%@", url);
}

  • NSTextCheckingTypeQuote : 不可用
  • NSTextCheckingTypeDash : 不可用
  • NSTextCheckingTypeReplacement : 不可用
  • NSTextCheckingTypeCorrection : 不可用
  • NSTextCheckingTypeRegularExpression : 不可用
  • NSTextCheckingTypePhoneNumber : 可用 ,用法有:
if ([match resultType] == NSTextCheckingTypePhoneNumber) {
            NSString *phoneNumber = [match phoneNumber];
            NSLog(@"phoneNumber:%@", phoneNumber);
}

  • NSTextCheckingTypeTransitInformation : 可用

好吧,总结出来就是:NSTextCheckingResult里面有对应的属性,那么这4种匹配就可用:URL,电话,日期,地址

下面是一个大神总结的具体的对应,相信大家一看就明白

Type Properties key值
NSTextCheckingTypeDate date, duration, timeZone
NSTextCheckingTypeAddress addressComponents NSTextCheckingNameKey, NSTextCheckingJobTitleKey, NSTextCheckingOrganizationKey, NSTextCheckingStreetKey, NSTextCheckingCityKey, NSTextCheckingStateKey, NSTextCheckingZIPKey, NSTextCheckingCountryKey, NSTextCheckingPhoneKey
NSTextCheckingTypeLink url
NSTextCheckingTypePhoneNumber phoneNumber
NSTextCheckingTypeTransitInformation components NSTextCheckingAirlineKey, NSTextCheckingFlightKey

奉送验证url方法:


-(BOOL) verifyURL{
    NSString * string = @"http://www.jianshu.com/users/72ee5da886ff/latest_articles";
    NSError * error = nil;
    NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink error:&error];

    NSArray<NSTextCheckingResult *> * matches = [detector matchesInString:string options:0 range:NSMakeRange(0, [string length])];
    if ([matches count] == 1 &&  matches[0].range.location == 0) {
        return YES;
    }

    return NO;
}

网上说:
注意:验证URL链接更简单的办法我们还可以借助系统提供的 canOpenURL() 方法来检测一个链接的有效性,比如上面样例可以改成如下的判断方式:

private func verifyUrl(str:String) -> Bool {        //创建NSURL实例        
     if let url = NSURL(string: str) {            //检测应用是否能打开这个NSURL实例           
         return UIApplication.sharedApplication().canOpenURL(url)        
     }        
     return false    
}

官网还告诉我们,解析自然语言用NSDataDetector.
如果文本已经是一种特殊规范了,那么解析它们应该用对应的方式.比如 用DateFormatter来解析 ISO 8601的时间戳.
像机器识别的文本:XML或者json.应该用 XMLParser
或者JSONSerialization来解析它们.

参考文章:
NSDataDetector官网文档
Swift中利用NSDataDetector提取字符串中所有链接(URL验证)
Stackorverflow
NSDataDetector取代iOS的某些正则表达式:URL,电话,日期,地址

相关文章

网友评论

      本文标题:NSDataDetector取代iOS的某些正则表达式:URL,

      本文链接:https://www.haomeiwen.com/subject/ytxslftx.html