美文网首页
NSCharacterSet

NSCharacterSet

作者: YummyDog | 来源:发表于2018-04-26 23:22 被阅读11次

    NSCharacterSet代表一个字符的集合,它通常结合NSString、NSScanner使用。

    使用场景

    这边介绍两个NSCharacter结合NSString的使用场景。
    在此之前,先来介绍一下NSString中两个跟NSCharacterSet有关的方法:

    //根据字符集来清理字符串两端的字符
    - (NSString *)stringByTrimmingCharactersInSet:(NSCharacterSet *)set;
    //根据字符集separator来分割字符串
    - (NSArray<NSString *> *)componentsSeparatedByCharactersInSet:(NSCharacterSet *)separator;
    

    例子1

    实现功能:

    清除字符串两端的数字
    

    代码我们可以这样写:

    NSString *string = @"123abc123";
            
    string = [string stringByTrimmingCharactersInSet:[NSCharacterSet decimalDigitCharacterSet]];
            
    NSLog(@"%@",string);
    

    打印结果是:

    abc
    

    例子2

    实现功能:

    清除字符串"Lorem    ipsum dolar   sit  amet."中多余的空格
    

    代码我们可以这样写:

    NSString *string = @"Lorem    ipsum dolar   sit  amet.";
    
    string = [string stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceCharacterSet]];
    
    NSArray *components = [string componentsSeparatedByCharactersInSet:[NSCharacterSet whitespaceCharacterSet]];
    components = ({
        NSMutableArray *mArr = [NSMutableArray new];
        for (NSString *str in components) {
            if ([str isEqualToString:@""] == NO) {
                [mArr addObject:str];
            }
        }
        mArr;
    });
    
    string = [components componentsJoinedByString:@" "];
    
    NSLog(@"%@",string);
    

    打印结果是:

    Lorem ipsum dolar sit amet.
    

    补充

    此处我只是列举了两个可能的使用场景,具体的需要结合实际需求来决定实现方案。
    另外例子2中,重组字符串的代码还可以这样写:

    components = [components filteredArrayUsingPredicate:[NSPredicate predicateWithFormat:@"self <> ''"]];
    

    NSCharacterSet

    说完NSCharacterSet的使用场景,接着来介绍一下NSCharacterSet的方法

    系统提供的常用字符集初始化类方法

    [NSCharacterSet controlCharacterSet];                  控制字符,包括换行符(\n)、制表符(\t)等,具体有哪些,不清楚
    [NSCharacterSet whitespaceCharacterSet];               空格符
    [NSCharacterSet whitespaceAndNewlineCharacterSet];     空格符、换行符
    [NSCharacterSet decimalDigitCharacterSet];             数字字符,0-9
    [NSCharacterSet letterCharacterSet];                   字母字符
    [NSCharacterSet lowercaseLetterCharacterSet];          小写字母字符
    [NSCharacterSet uppercaseLetterCharacterSet];          大写字母字符
    [NSCharacterSet nonBaseCharacterSet];
    [NSCharacterSet alphanumericCharacterSet];             字母、数字字符
    [NSCharacterSet decomposableCharacterSet];
    [NSCharacterSet illegalCharacterSet];
    [NSCharacterSet punctuationCharacterSet];              标点符号字符,指在用于分隔文字的符号
    [NSCharacterSet capitalizedLetterCharacterSet];
    [NSCharacterSet symbolCharacterSet];                   符号字符,除了标点符号之外,例如¥、$这样的符号
    [NSCharacterSet newlineCharacterSet];                  换行字符
    

    在这其中,controlCharacterSet、nonBaseCharacterSet、decomposableCharacterSet、illegalCharacterSet、capitalizedLetterCharacterSet这几个,我都不理解,有明白的朋友希望不吝赐教。

    uppercaseLetterCharacterSet与capitalizedLetterCharacterSet

    在stackoverflow上找到了一个问题,其中谈及了uppercaseLetterCharacterSet与capitalizedLetterCharacterSet的关系,传送门

    According to the docs, +capitalizedLetterCharacterSet contains the Titlecase category, whereas +uppercaseLetterCharacterSet contains Uppercase and Titlecase.

    capitalizedLetterCharacterSet包含Titlecase,而uppercaseLetterCharacterSet包含Uppercase和Titlecase,简而言之,capitalizedLetterCharacterSet是uppercaseLetterCharacterSet的子集。

    自定义初始化方法

    //通过范围初始化NSCharacterSet,此处的range指的是unicode在码表上的范围
    + (NSCharacterSet *)characterSetWithRange:(NSRange)aRange;
    //通过字符串初始化NSCharacterSet
    + (NSCharacterSet *)characterSetWithCharactersInString:(NSString *)aString;
    //通过二进制数据初始化NSCharacterSet
    + (NSCharacterSet *)characterSetWithBitmapRepresentation:(NSData *)data;
    //通过文件初始化NSCharacterSet
    + (nullable NSCharacterSet *)characterSetWithContentsOfFile:(NSString *)fName;
    

    这里用实际代码说明一下characterSetWithRange的使用

    //生成一个包含字符'a'~'z'的字符集
    NSRange lcEnglishRange;
    NSCharacterSet *lcEnglishLetters;
    
    lcEnglishRange.location = (unsigned int)'a';
    lcEnglishRange.length = 26;
    lcEnglishLetters = [NSCharacterSet characterSetWithRange:lcEnglishRange];
    

    属性

    //字符集的二进制数据,用于传输、归档、保存成文件
    @property (readonly, copy) NSData *bitmapRepresentation;
    
    //一个除了数字字符之外的所有字符的字符集
    [[NSCharacterSet decimalDigitCharacterSet] invertedSet]
    

    用于判断的方法

    //判断aCharacter是否包含在字符集中
    - (BOOL)characterIsMember:(unichar)aCharacter;
    //功能貌似是一样的,入参是UTF-32的字符???不知道这两个方法的区别,知道的朋友不吝赐教
    - (BOOL)longCharacterIsMember:(UTF32Char)theLongChar;
    
    //判断theOtherSet是不是自身的子集
    - (BOOL)isSupersetOfSet:(NSCharacterSet *)theOtherSet;
    

    可以用来验证capitalizedLetterCharacterSet是否是uppercaseLetterCharacterSet的子集

    不明白的地方

    - (BOOL)hasMemberInPlane:(uint8_t)thePlane;
    

    这个貌似涉及到Unicode的知识,我暂时没研究明白,有兴趣的可以,看看这篇文章传送门

    NSMutableCharacterSet

    //添加某个范围的字符到字符集
    - (void)addCharactersInRange:(NSRange)aRange;
    //移除某个范围的字符到字符集
    - (void)removeCharactersInRange:(NSRange)aRange;
    //添加字符串中的字符到字符集
    - (void)addCharactersInString:(NSString *)aString;
    //移除字符串中的字符到字符集
    - (void)removeCharactersInString:(NSString *)aString;
    //合并两个字符集
    - (void)formUnionWithCharacterSet:(NSCharacterSet *)otherSet;
    //保留两个字符集的集合,即两个字符集都有的字符的集合
    - (void)formIntersectionWithCharacterSet:(NSCharacterSet *)otherSet;
    

    相关阅读

    NSHipster.cn上的一篇译文:NSHipster-NSCharaterSet

    相关文章

      网友评论

          本文标题:NSCharacterSet

          本文链接:https://www.haomeiwen.com/subject/jtvylftx.html