2.8 Swift 3 为自定义类型实现Hashable Key

作者: CDLOG | 来源:发表于2019-01-15 10:56 被阅读0次

2.8 Swift 3 为自定义类型实现Hashable Key
swift自定义值类型做字典的key注意！！！
Swift Hashable
swift基础语法(字典)
Swift 新特性 Hasher
Swift 4.1 - SE-0188 Make Standar
从Swift3的标准库协议看面向协议编程(一)
Python2.7学习笔记 dict&set
如何在关联容器中使用自定义类型
Swift3.0--字典（Dictionary）

本质上来说，Dictionary是一个哈希表，它所有的key都用各自的哈希值保存在一个数组里。因此，通过key在Dictionary中访问value是一个O(1)操作。但这也对key的类型做出了一个要求，它必须可以计算哈希值。Swift标准库中提供的绝大多数类型，例如：Int / Float / Double / String / Bool / Date ...等，都满足这个要求，因此我们可以直接拿它们来定义Dictionary。

但如果我们有一个自定义类型Account，表示泊学的网站账号，其中的alias / type / createdAt分别表示账号的别名、类型和注册日期：

 struct Account {
    var alias: String
    var type: Int
    var createdAt: Date
}

当我们把Account用作key的时候，Swift就会给我们提示下面的错误：Account没有遵从Hashable protocol：

let account11 = Account(alias: "11",
    type: 1, createdAt  : Date())
let data:[Account: Int] = [ account11: 1000 ]

Hashable requirement

Conform to Hashable protocol

如何让自定义类型遵从Hashable protocol呢？第一件要做的事，就是告诉Swift，如何获取一个类型的哈希值，这是通过一个叫hashValue的属性完成的：

extension Account: Hashable {
    var hashValue: Int
}

如何计算Account.hashValue呢？有两个最重要的考量，分别是：性能和哈希值在整数范围的分布。因为每当我们要在Dictionary中查询、添加、修改或删除元素的时候，都要计算key的哈希值，如果这个计算过于消耗性能，那么计算哈希值的过程就有可能抵消掉通过key随机访问value带来的O(1)性能提升。

当然，你也不能盲目追求性能而忽视哈希值的整数值分布。说一个最极端的例子，如果你让所有情况计算得到的哈希值都是某个常数：

extension Account: Hashable {
    // A BAD idea
    var hashValue: Int { return 1 }
}

这个哈希函数有O(1)的性能，但这样，不同的Account对象就会有不同的哈希值，这叫做Collision。当然，Swift Dictionary可以处理哈希值碰撞的情况，但你要随之付出的代价就是，通过哈希值读取value将从一个O(1)变成一个O(n)算法。因此，让哈希值在整数区间均匀分布也是设计哈希函数很重的考虑。

综上所述，设计一个好的哈希函数并不是一个容易的事情。对于我们来说，可以假设Swift标准库的类型提供的hashValue都满足性能和分布的要求。因此，当我们设计复合类型的哈希值的时候，可以基于这些标准类型的哈希值进行一些“低功耗”运算，例如，对这些值进行异或运算，绝大多数的CPU都对这个操作提供了指令级支持：

extension Account: Hashable {
    var hashValue: Int {
        return alias.hashValue ^
                type.hashValue ^
                createdAt.hashValue
    }
}

解决了Account的哈希值之后，Swift会继而提示我们：Account没有遵从Equatable protocol。为什么还要遵从Equatable呢？这是因为哈希函数还有一个很重要的性质：两个相等对象的哈希值必须是相同的。因此，我们必须要解决什么叫做两个相等的对象，然后才有比较它们各自哈希值的事情。

Equatable只有一个约束，就是为自定义类型实现==操作符：

extension Account: Equatable {
    static func == (lhs: Account, rhs: Account) -> Bool {
        return lhs.alias == rhs.alias &&
            lhs.type == rhs.type &&
            lhs.createdAt == rhs.createdAt
    }
}

在Swift里，运算符必须要定义成static方法，它的两个参数lhs / rhs则表示==两边的操作数。我们判断Account相等的方式很简单，只要它们每一个属性相等，则两个Account对象就是相等的。

当我们让Account遵从了Equatable之后，Swift编译器就不会再报错了。此时，我们在一开始创建的data也可以正常工作了。

Bitwise rotation

我们上面例子中提到的把所有属性进行XOR运算的方法，虽然简单高效，但也有一个问题，就是比较容易造成碰撞。因为XOR运算是可交换的，也就是说a ^ b == b ^ a，因此，如果一个自定义类型中，有多个类型相同属性的时候，就会增大哈希值发生碰撞的概率，因此，我们可以用下面的代码，对其中的一些基础属性的哈希值进行按位旋转后再进行XOR运算：

struct Account {
    let INT_BIT = (Int)(CHAR_BIT) * MemoryLayout<Int>.size

    func bitwiseRotate(value: Int, bits: Int) -> Int {
        return (((value) << bits) | ((value) >> (UINT_BIT - bits)))
    }
}

extension Account: Hashable {
    var hashValue: Int {
        return bitwiseRotate(value: alias.hashValue, bits: 10) ^
            type.hashValue ^
            createdAt.hashValue
    }
}

首先，我们在Account中添加了一个常量INT_BIT表示一个整数的位数。其次，定义了一个辅助方法bitwiseRotate(value:bits:)，它用于先把value向左移动bits位，再向右移动(UINT_BIT - bits)位。

有了这个方法之后，我们就可以在计算哈希值的时候，对其中的属性进行按位旋转了。

警惕引用类型的Key

和Dictionary.Key相关的最后一个内容，是尽可能避免使用引用类型作为key，这通常会给你带来不必要的麻烦。当一个引用类型作为key之后，当引用类型的对象在Dictionary之外被修改的时候，Key的内容也会随之修改。这样你就再也无法获得之前的哈希值，也就无法获得对应的value了。

What's next?

以上就是和如何用自定义类型作为Key相关的话题，至此，我们对Dictionary的讨论就可以告一段落了。在下一节中，我们会看到Swift标准库中的另外一个无序集合：Set。

网友评论

本文标题：2.8 Swift 3 为自定义类型实现Hashable Key

本文链接：https://www.haomeiwen.com/subject/fwqlkqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

2.8 Swift 3 为自定义类型实现Hashable Key

Conform to Hashable protocol

Bitwise rotation

警惕引用类型的Key

What's next?

相关文章