一. NSDataDetector介绍
NSDataDetector 是继承于 NSRegularExpression 的一个子类。使用的时候只需要指定要匹配的类型(日期、地址、URL等)就可以提取的想要的信息,而不需要自己再写复杂的表达式。
苹果对一些常用的正则匹配都作了封装,如时间,时区,网页链接url,电话号码等等,而且这些识别是国际化的,比如中国的手机号是13044345467,XX国的手机号是932-23333222,它都可以识别.又比如中国人的名字是王大明,英国人的名字是 William Jafferson Clinton,也都能识别.
我们不用自己去写正则表达式匹配,而采用NSDataDetector.
阅读它的描述已经能获取大多数信息.
二. 使用方法:
1. 使用NSRegularExpression的方法.
作为NSRegularExpression的子类,它可使用其所有方法.numberOfMatchesInString:options:range就是其一,查看一共有多少匹配项.还有matches(in:options:range:)和firstMatch(in:options:range:)
NSString * string = @"欢迎访问http://www.111cn.net,https://111cn.net\n以及ftp://111cn.net";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypePhoneNumber| NSTextCheckingTypeLink error:&error];
NSUInteger numberOfMatches = [detector numberOfMatchesInString:string
options:0
range:NSMakeRange(0, [string length])];
2. 这是matches(in:options:range:)的用法:
NSString * string = @"欢迎访问http://www.jianshu.com/users/72ee5da886ff/latest_articles. 咱的电话是012-1304445928.ps:电话随便写的哟.今天是2016-10-25,天气(weather)不错";
NSString * string = @"欢迎访问http://www.jianshu.com/users/72ee5da886ff/latest_articles. 咱的电话是012-1304445928.ps:电话随便写的哟.今天是2016-10-25,天气(weather)不错";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink|NSTextCheckingTypePhoneNumber error:&error];
NSArray *matches = [detector matchesInString:string
options:0
range:NSMakeRange(0, [string length])];
for (NSTextCheckingResult *match in matches) {
NSRange matchRange = [match range];
if ([match resultType] == NSTextCheckingTypeLink) {
NSURL *url = [match URL];
NSLog(@"url:%@", url);
} else if ([match resultType] == NSTextCheckingTypePhoneNumber) {
NSString *phoneNumber = [match phoneNumber];
NSLog(@"phoneNumber:%@", phoneNumber);
}
}
3.块是另一种形式,比较灵活和高效.
为何?因为它是每找到一个match,就进入块一次.
比如一共有4个match,它就会进入4次块.
所以你可以用块的参数stop控制这个块.如果你已经找到需要的match,就设置stop为YES,就不会继续找match了.
NSString * string = @"欢迎访问http://www.jianshu.com/users/72ee5da886ff/latest_articles. 咱的电话是012-1304445928.ps:电话随便写的哟.今天是2016-10-25,天气(weather)不错";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink|NSTextCheckingTypePhoneNumber error:&error];
__block NSUInteger count = 0;
[detector enumerateMatchesInString:string options:0 range:NSMakeRange(0, [string length]) usingBlock:^(NSTextCheckingResult * _Nullable match, NSMatchingFlags flags, BOOL * _Nonnull stop) {
NSLog(@"flag:%lu",(unsigned long)flags);
NSRange matchRange = [match range];
if ([match resultType] == NSTextCheckingTypeLink) {
NSURL *url = [match URL];
NSLog(@"url:%@", url);
}
if (count == 0) *stop = YES;
if ([match resultType] == NSTextCheckingTypePhoneNumber) {
NSString *phoneNumber = [match phoneNumber];
NSLog(@"phoneNumber:%@", phoneNumber);
}
}];
三. 知识点分析
1.options参数
enumerateMatchesInString:range:usingBlock:的options参数官网demo写的是0, 它有个枚举:
-
NSMatchingReportProgress
: 网上说是:找到最长的匹 配字符串后调用block回调.我实验后发现它进入了很多很多次.... so 这个枚举没搞懂 -
NSMatchingReportCompletion
: 当匹配都完成后,还会进入一次block,汇报完成 -
NSMatchingAnchored
: 网上说:从匹配范围的开始出进行极限匹配 .我实验后一次都没进入 -
NSMatchingWithTransparentBounds
: 网上说:允许匹配的范围超出设置的范围. 实验后,正常,有几次匹配就进入几次 -
NSMatchingWithoutAnchoringBounds
: 文档说:禁止^和$自动匹配开始和结束. 实验后,正常,有几次匹配就进入几次
2. NSDataDetector的checkingTypes
上面是比较常用的匹配方式,细心的孩子肯定注意到,NSDataDetector可匹配的枚举还有好多个,是否每个都可用呢?
亲身实验,发现有的不行,运行时程序会报错(no data detector types specified'),说没有这个枚举
- NSTextCheckingTypeOrthography : 不可用
- NSTextCheckingTypeSpelling : 不可用
- NSTextCheckingTypeGrammar : 不可用
- NSTextCheckingTypeDate : 可用, 用法有
if ([match resultType] == NSTextCheckingTypeDate) {
NSDate *date = [match date];
NSLog(@"date:%@", date);
NSTimeZone * timezone = [match timeZone];
NSLog(@"time zone:%@", timezone);
CFTimeInterval duration = [match duration];
NSLog(@"duration:%f", duration);
}
- NSTextCheckingTypeAddress : 可用, 用法有:
if ([match resultType] == NSTextCheckingTypeAddress) {
NSDictionary<NSString *, NSString *> * addressComponent = [match addressComponents];
NSLog(@"城市:%@, 街道:%@", addressComponent[NSTextCheckingCityKey], addressComponent[NSTextCheckingStreetKey]);
}
- NSTextCheckingTypeLink : 可用 , 用法有:
if ([match resultType] == NSTextCheckingTypeLink) {
NSURL *url = [match URL];
NSLog(@"url:%@", url);
}
- NSTextCheckingTypeQuote : 不可用
- NSTextCheckingTypeDash : 不可用
- NSTextCheckingTypeReplacement : 不可用
- NSTextCheckingTypeCorrection : 不可用
- NSTextCheckingTypeRegularExpression : 不可用
- NSTextCheckingTypePhoneNumber : 可用 ,用法有:
if ([match resultType] == NSTextCheckingTypePhoneNumber) {
NSString *phoneNumber = [match phoneNumber];
NSLog(@"phoneNumber:%@", phoneNumber);
}
- NSTextCheckingTypeTransitInformation : 可用
好吧,总结出来就是:NSTextCheckingResult里面有对应的属性,那么这4种匹配就可用:URL,电话,日期,地址
下面是一个大神总结的具体的对应,相信大家一看就明白
Type | Properties | key值 |
---|---|---|
NSTextCheckingTypeDate | date, duration, timeZone | |
NSTextCheckingTypeAddress | addressComponents | NSTextCheckingNameKey, NSTextCheckingJobTitleKey, NSTextCheckingOrganizationKey, NSTextCheckingStreetKey, NSTextCheckingCityKey, NSTextCheckingStateKey, NSTextCheckingZIPKey, NSTextCheckingCountryKey, NSTextCheckingPhoneKey |
NSTextCheckingTypeLink | url | |
NSTextCheckingTypePhoneNumber | phoneNumber | |
NSTextCheckingTypeTransitInformation | components | NSTextCheckingAirlineKey, NSTextCheckingFlightKey |
奉送验证url方法:
-(BOOL) verifyURL{
NSString * string = @"http://www.jianshu.com/users/72ee5da886ff/latest_articles";
NSError * error = nil;
NSDataDetector * detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink error:&error];
NSArray<NSTextCheckingResult *> * matches = [detector matchesInString:string options:0 range:NSMakeRange(0, [string length])];
if ([matches count] == 1 && matches[0].range.location == 0) {
return YES;
}
return NO;
}
网上说:
注意:验证URL链接更简单的办法我们还可以借助系统提供的 canOpenURL() 方法来检测一个链接的有效性,比如上面样例可以改成如下的判断方式:
private func verifyUrl(str:String) -> Bool { //创建NSURL实例
if let url = NSURL(string: str) { //检测应用是否能打开这个NSURL实例
return UIApplication.sharedApplication().canOpenURL(url)
}
return false
}
官网还告诉我们,解析自然语言用NSDataDetector.
如果文本已经是一种特殊规范了,那么解析它们应该用对应的方式.比如 用DateFormatter来解析 ISO 8601的时间戳.
像机器识别的文本:XML或者json.应该用 XMLParser
或者JSONSerialization来解析它们.
参考文章:
NSDataDetector官网文档
Swift中利用NSDataDetector提取字符串中所有链接(URL验证)
Stackorverflow
NSDataDetector取代iOS的某些正则表达式:URL,电话,日期,地址
网友评论