Swift 中的字符串截取

作者: 萌面大道 | 来源:发表于2016-12-14 18:48 被阅读2296次

    由于种种原因,简书等第三方平台博客不再保证能够同步更新,欢迎移步 GitHub:https://github.com/kingcos/Perspective/。谢谢!

    Substring in Swift 3.0

    • Info:
    • macOS 10.12.2 Beta
    • Xcode 8.2 Beta
    • Swift 3.0

    前言

    最近更文的频率也是越来越慢,除去已到期末的缘故,加上在忙老师的项目,自己的时间便被压缩殆尽。不过好在 Swift 设计模式基本上已经更新完毕,下来就准备补齐每个模式对应的说明。

    在尝试使用 Swift 实现《大话设计模式》一书中的解释器模式时,书中的 Demo 多次使用了截取字符串的方法,当然,Swift 作为一门先进的编程语言不会缺少这一常用的方法。然而在使用中,可能由于 Swift 是一门较为注重(类型)安全的语言,其字符串截取方法使用方式与 Java 等编程语言便有一些语法上的不同。在 Swift 自身的迭代过程中,这部分的语法变化也很大。所以这次就来简单研究一下 Swift 中的字符串截取。需要注意的是,虽然 Swift 也可以使用 NSString 类型的字符串,而且两者可以很容易的桥接,但考虑到个人对 Objective-C 的了解程度,便暂时不探讨。

    String.Index

    Basics

    索引与下标,即 index 和 subscript。一般来说,两者的概念是类似的,不过个人觉得索引有泛指的概念,而下标是具体的。

    Swift 中字符串的索引类型并不是其他语言中的整型(int),而是 String.Index。String.Index,即标注字符串的索引类型。在 Swift 的标准库中,可以看到其本质是 String.CharacterView.Index 的别名。

    /// The index type for subscripting a string.
    public typealias Index = String.CharacterView.Index
    

    再进一步查看 String.CharacterView,即创建给定字符串的字符视图类型。

    public struct CharacterView {
    
        /// Creates a view of the given string.
        public init(_ text: String)
    }
    

    常用的 "maimieng.com".characters 的类型其实就是 String.CharacterView 类型。.characters 将字符串内容转化为字符序列的视图。

    start & end

    字符串必然是一个字符的有限序列,Swift 为了方便开发者迅速定位,便集成了 startIndexendIndex。但是需要注意的是:startIndex 是指字符串的第一个字符的下标,而 endIndex 是指字符串的最后一个字符之后的下标。当字符串为空时,startIndexendIndex 相同。

    var str = "maimieng.com"
    
    print(str.characters.count)
    
    print(str.startIndex)
    print(str.endIndex)
    
    // 12
    // Index(_base: Swift.String.UnicodeScalarView.Index(_position: 0), _countUTF16: 1)
    // Index(_base: Swift.String.UnicodeScalarView.Index(_position: 12), _countUTF16: 0)
    

    从上面的 Demo 也可以看出,startIndex 的位置为 0,而 endIndex 的位置为 12,等同于字符串的长度,而不是字符串长度减一。

    除了给出了起始和结尾的下标,Swift 也提供了根据下标定位其他索引的方法:

    public func index(after i: String.Index) -> String.Index
    public func index(before i: String.Index) -> String.Index
    
    public func index(_ i: String.Index, offsetBy n: String.IndexDistance) -> String.Index
    public func index(_ i: String.Index, offsetBy n: String.IndexDistance, limitedBy limit: String.Index) -> String.Index?
    

    这样就可以通过给出的 startIndexendIndex 来定位到其他的下标了。

    var str = "maimieng.com"
    
    // 返回传入下标之后的下标
    print(str.index(after: str.startIndex))
    // 返回传入下标之前的下标
    print(str.index(before: str.endIndex))
    
    // 返回传入下标偏移后的下标(偏移量可正可负可为 0)
    print(str.index(str.startIndex, offsetBy: 1))
    
    // print(str.index(str.endIndex, offsetBy: 10))
    // 作用同上,但如果超过传入的界限返回 nil
    print(str.index(str.endIndex, offsetBy: 10, limitedBy: str.endIndex) ?? "越界")
    

    下标之间的间距,也可以利用 func distance(from start: String.Index, to end: String.Index) -> String.IndexDistance 方法求出:

    var str = "maimieng.com"
    
    print(str.distance(from: str.startIndex, to: str.endIndex))
    // 12
    print(str.distance(from: str.endIndex, to: str.startIndex))
    // -12
    

    Range

    Range 即范围,Swift 中实现了 Comparable 协议的类型都可以用 Range 来表示范围。以下的 Range 特指:Range<String.Index>

    Range 的构造方法是 init(uncheckedBounds bounds: (lower: Bound, upper: Bound))。即传入一个元组,返回一个范围。需要注意的是:这个范围 Swift 是不会检查的,需要程序员自觉维护。

    var str = "maimieng.com"
    
    // 前闭后开
    let rangeA = Range(uncheckedBounds: (str.startIndex, str.endIndex))
    print(rangeA)
    // Index(_base: Swift.String.UnicodeScalarView.Index(_position: 0), _countUTF16: 1)..<Index(_base: Swift.String.UnicodeScalarView.Index(_position: 12), _countUTF16: 0)
    
    print(str.substring(with: rangeA))
    // maimieng.com
    
    // 即使范围首尾颠倒,也没有报错
    let rangeB = Range(uncheckedBounds: (str.endIndex, str.startIndex))
    print(rangeB)
    // Index(_base: Swift.String.UnicodeScalarView.Index(_position: 12), _countUTF16: 0)..<Index(_base: Swift.String.UnicodeScalarView.Index(_position: 0), _countUTF16: 1)
    // 但在使用中会出错
    // fatal error: Can't form Range with upperBound < lowerBound
    // str.substring(with: rangeB)
    

    在上面的 Demo 中,从输出中也可以看出,init(uncheckedBounds bounds: (lower: Bound, upper: Bound)) 构造的范围是一个前闭后开的区间。

    Swift 中,字符串本身也能构造出 Range,例如:得到字符串子串的范围,若不存在则返回 nil:

    var str = "maimieng.com"
    
    // 返回前闭后开的范围
    print(str.range(of: ".com") ?? "不存在")
    // Index(_base: Swift.String.UnicodeScalarView.Index(_position: 8), _countUTF16: 1)..<Index(_base: Swift.String.UnicodeScalarView.Index(_position: 12), _countUTF16: 0)
    

    substring

    在 Range 一节的 Demo 中,已经使用了 substring(with:) 方法测试范围的使用。Swift 中的字符串截取与其他语言其实是相似的,都是根据索引或索引范围来截取,只是 Swift 中的索引的类型不是整型,稍有麻烦。

    var str = "maimieng.com"
    
    // 截取传入范围(左开右闭)的子串
    let range = Range(uncheckedBounds: (str.startIndex, str.endIndex))
    print(str.substring(with: range))
    
    // 从传入的索引开始截取到末尾(含 str.startIndex 元素)
    print(str.substring(from: str.startIndex))
    // 从传入的索引的前一个位置开始截取到头部(不含 str.endIndex 元素)
    print(str.substring(to: str.endIndex))
    
    // maimieng.com
    // maimieng.com
    // maimieng.com
    

    以上的 Demo 便是 Swift 中最基本的截取字符串使用。然而有时候条件一多,代码的重复率也会增加,那么可以利用 Swift 中的 extension 来扩展原有的 String,让 Swift 的 String 可以像 C#、Java 一样截取字符串,需要注意的是 这里的 IndexDistance 实际上是 String.CharacterView.IndexDistance 的别名,而 String.CharacterView.IndexDistance 又是 Int 类型的别名。

    extension String {
        func substring(from: IndexDistance) -> String? {
            let index = self.index(self.startIndex, offsetBy: from)
            return str.substring(from: index)
        }
        
        func substring(to: IndexDistance) -> String? {
            let index = self.index(self.startIndex, offsetBy: to + 1)
            return str.substring(to: index)
        }
        
        func substring(with range: Range<IndexDistance>) -> String? {
            let lower = self.index(self.startIndex, offsetBy: range.lowerBound)
            let upper = self.index(self.startIndex, offsetBy: range.upperBound)
            let range = Range(uncheckedBounds: (lower, upper))
            return str.substring(with: range)
        }
        
        func substring(_ lower: IndexDistance, _ range: IndexDistance) -> String? {
            let lowerIndex = self.index(self.startIndex, offsetBy: lower)
            let upperIndex = self.index(lowerIndex, offsetBy: range)
            let range = Range(uncheckedBounds: (lowerIndex, upperIndex))
            return str.substring(with: range)
        }
    }
    
    print(str.substring(to: 0) ?? "nil")
    print(str.substring(from: 2) ?? "nil")
    print(str.substring(with: 0..<1) ?? "nil")
    print(str.substring(1, 2) ?? "nil")
    
    // m
    // imieng.com
    // m
    // ai
    

    参考资料

    Documentation & API Reference

    相关文章

      网友评论

        本文标题:Swift 中的字符串截取

        本文链接:https://www.haomeiwen.com/subject/arzimttx.html