美文网首页
快学Scala第14章----模式匹配和样例类

快学Scala第14章----模式匹配和样例类

作者: 胡杨1015 | 来源:发表于2016-07-02 21:29 被阅读0次

    本章要点

    • match表达式是一个更好的switch,不会有意外掉入到下一个分支的问题。
    • 如果没有模式能够匹配,会抛出MatchError。可以用case _ 模式来避免。
    • 模式可以包含一个随意定义的条件,称作守卫。
    • 你可以对表达式的类型进行匹配;优先选择模式匹配而不是isInstanceOf/asInstanceOf。
    • 你可以匹配数组、元组和样例类的模式,然后将匹配到的不同部分绑定到变量。
    • 在for表达式中,不能匹配的情况会被安静的跳过。
    • 样例类继承层级中的公共超类应该是sealed的。
    • 用Option来存放对于可能存在也可能不存在的值----这比null更安全。

    更好的switch

    以下是Scala中C风格switch语句的等效代码:

    var sign = ...
    val ch: Char = ...
    
    ch match {
      case '+' => sign = 1
      case '-' => sign = -1
      case _ => sign = 0
    }
    

    在这里,case _ 与 C 语言的 default 相同,可以匹配任意的模式,所以要注意放在最后。C 语言的 switch中的case语句必须使用break才能推出当前的分支,否则会继续执行后面的分支,直到遇到break或者结束; 而Scala的模式匹配只会匹配到一个分支,不需要使用break语句,因为它不会掉入到下一个分支。
    match是表达式,与if一样,是有值的:

    sign = ch match {
      case '+' => 1
      case '-' => -1
      case _ => 0
    }
    

    守卫

    在C语言中,如果你想用switch判断字符是数字,则必须这么写:

    switch(ch) {
      case '0':
      case '1':
      case '2':
      case '3':
      ...
      case '8':
      case '9': do something; break;
      default: ...; 
    }
    

    你要写10条case语句才可以匹配所有的数字;而在Scala中,你只需要给模式添加守卫:

    ch match {
      case '+' => 1
      case '-' => -1
      case _ if Character.isDigit(ch) => digit = Character.digit(ch, 10)
      case _ => 0
    }
    

    模式匹配中的变量

    如果case关键字后面跟着一个变量名,那么匹配的表达式会被赋值给那个变量。

    str(i) match {
      case '+' => 1
      case '-' => -1
      case ch => digit = Character.digit(ch, 10)
    }
    
    // 在守卫中使用变量
    str(i) match {
      case ch if Character.isDigit(ch) => digit = Character.digit(ch, 10)
      ...
    }
    

    **注意: **Scala是如何在模式匹配中区分模式是常量还是变量表达式: 规则是变量必须是以小写字母开头的。 如果你想使用小写字母开头的常量,则需要将它包在反单引号中。


    changliang.png

    类型模式

    你可以对表达式的类型进行匹配,例如:

    obj match {
      case x: Int => x
      case s: String => Integer.parseInt(s)
      case _: BigInt => Int.MaxValue
      case - => 0
    }
    

    在Scala中我们会优先选择模式匹配而不是isInstanceOf/asInstanceOf。
    **注意: **当你在匹配类型的时候,必须给出一个变量名,否则你将会拿对象本身来进行匹配:

    obj match {
      case _: BigInt => Int.MaxValue  // 匹配任何类型为BigInt的对象
      case BigInt => -1              // 匹配类型为Class的BigInt对象
    }
    

    **注意: **匹配发生在运行期,Java虚拟机中泛型的类型信息是被擦掉的。因此,你不能用类型来匹配特定的Map类型。

    case m: Map[String, Int] => ...   // error
    // 可以匹配一个通用的映射
    case m: Map[_, _] => ...   // OK
    
    // 但是数组作为特殊情况,它的类型信息是完好的,可以匹配到Array[Int]
    case m: Array[Int] => ...   // OK
    

    匹配数组、列表和元组

    要匹配数组的内容,可以在模式中使用Array表达式:

    arr match {
      case Array(0) => "0"                  // 任何包含0的数组
      case Array(x, y) => x + " " + y   // 任何只有两个元素的数组,并将两个元素本别绑定到变量x 和 y
      case Array(0, _*) => "0 ..."         // 任何以0开始的数组
      case _ => "Something else"
    }
    

    同样也可以应用到List

    lst match {
      case 0 :: Nil => "0"
      case x :: y :: Nil => x + " " + y
      case 0 :: tail => "0 ..."
      case _ => "Something else"
    }
    

    对于元组:

    pair match {
      case (0, _) => "0, ..."
      case (y, 0) => y + " 0"
      case _ => "neither is 0"
    }
    

    提取器

    在上面的模式是如何匹配数组、列表、元组的呢?Scala是使用了提取器机制----带有从对象中提取值的unapply 或 unapplySeq方法的对象。其中, unapply方法用于提取固定数量的对象;而unapplySeq提取的是一个序列,可长可短。

    arr match {
      case Array(0, x) => ...  // 匹配有两个元素的数组,其中第一个元素是0,第二个绑定给x
    }
    

    Array伴生对象就是一个提取器----它定义了一个unapplySeq方法。该方法执行时为:Array.unapplySeq(arr) 产出一个序列的值。第一个值于0进行比较,第二个赋值给x。
    正则表达式也可以用于提取器的场景。如果正则表达式有分组,可以用模式提取器来匹配每个分组:

    val pattern = "([0-9]+) ([a-z]+)".r
    "99 bottles" match {
      case pattern(num, item) => ...   // 将num设为99, item设为"bottles"
    }
    

    注意: 在这里提取器并不是一个伴生对象,而是一个正则表达式对象。


    变量声明中的模式

    在变量声明中也可以使用变量的模式匹配:

    val (x, y) = (1, 2)  // 把x定义为1, 把y定义为2.
    val (q, r) = BigInt(10) /% 3   // 匹配返回对偶的函数
    
    // 匹配任何带有变量的模式
    val Array(first, second, _*)  = arr  
    

    for表达式中的模式

    你可以在for推导式中使用带变量的模式。

    import scala.collection.JavaConversions.propertiesAsScalaMap
    for ((k, v) <- system.getProperties()) {
      println(k + " -> " + v)
    }
    

    在for推导式中,失败的匹配将被安静的忽略。例如:

    // 只匹配值为空的情况
    for ((k, "") <- system.getProperties()) {
      println(k)
    }
    
    // 也可以使用守卫
    for ((k, v) <- system.getProperties() if v == "") {
      println(k)
    }
    

    样例类

    样例类是一种特殊的类,它们经过优化以被用于模式匹配。

    abstract class Amount
    case class Dollar(value; Double) extends Amount
    case class Currency(value: Double, unit: String) extends Amount
    
    // 针对单例的样例对象
    case object Nothing extends Amount
    
    // 将Amount类型的对象用模式匹配来匹配到它的类型,并将属性值绑定到变量:
    amt match {
      case Dollar(v) => "$" + v
      case Currency(_, u) => "Oh noes, I got " + u
      case Nothing => ""
    }
    

    当你声明样例类时,如下事情会自动发生:

    • 构造器中每一个参数都成为val----除非它被显示的声明为var(不建议这样做)
    • 在伴生对象中提供apply方法让你不用new关键字就能够构造出相应的对象,例如Dollar(2)或Currency(34, "EUR")
    • 提供unapply方法让模式匹配可以工作
    • 将生成toString、equals、hashCode和copy方法----除非你显示的给出这些方法的定义。

    copy方法和带名参数

    样例类的copy方法创建一个与现有对象值相同的新对象。例如:

    val amt = Currency(29.95, "EUR")
    val price = amy.copy()    // Currency(29.95, "EUR")
    val price2 = amt.copy(value = 19.95)  // Currency(19.95, "EUR")
    val price3 = amt.copy(unit = "CHF")    // Currency(29.95, "CHF")
    

    case语句中的中置表示法

    如果unapply方法产出一个对偶,则可以在case语句中使用中置表示法。尤其是对于两个参数的样例类,你可以使用中置表示法来表示它。

    amt match { case a Currency u => ... }  // 等同于 case Currency(a, u)
    

    这个特性的本意是要匹配序列。例如:每个List对象要么是Nil,要么是样例类::, 定义如下:

    case class ::[E](head: E, tail: List[E]) extends List[E]
    // 因此你可以这么写
    lst match {
      case h :: t => ...   // 等同于 case ::(h, t), 将调用::.unapply(lst)
    }
    

    匹配嵌套结构

    样例类经常被用于嵌套结构。例如:商店售卖的商品:

    abstract class Item
    case class Article(description: String, price: Double) extends Item
    case class Bundle(description: String, discount: Double, items: Item*) extends Item
    
    // 产生嵌套对象
    Bundle("Father's day special", 20.0, Article("Scala for the Impatient", 39.95), 
      Bundle("Anchor Distillery Sampler", 10.0, Article("Old Potrero Straight Rye Whisky", 79.95),
        Article("Junipero Gin", 32.95)))
    
    // 模式匹配到特定的嵌套,比如:
    case Bundle(_, _, Article(descr, _), _*) => ... 
    

    上述代码将descr绑定到Bundle的第一个Article的描述。你也可以@表示法将嵌套的值绑定到变量:

    case Bundle(_, _, art @ Article(_, _), rest @ _*) => ...
    

    这样,art就是Bundle中的第一个Article, 而rest则是剩余Item的序列。 _*代表剩余的Item。
    该特性实际应用:

    def price(it: Item): Double = it match {
      case Article(_, p) => p
      case Bundle(_, disc, its @ _*) => its.map(price _).sum - disc
    }
    

    样例类是邪恶的吗

    样例类适用于那种标记了不会改变的结构。例如Scala的List就是用样例类实现的。

    abstract class List
    case object Nil extends List
    case class ::(head: Any, tail: List) extends List
    

    当用在合适的地方时,样例类是十分便捷的,原因如下:

    • 模式匹配通常比继承更容易把我们引向更精简的代码。
    • 构造时不需要用new的符合对象更加易读
    • 你将免费获得toString、equals、hashCode和copy方法。
      对于样例类:
    case class Currency(value: Double, unit: String)
    

    一个Currency(10, "EUR")和任何其他Currency(10, "EUR")都是等效的,这也是equals和hashCode方法实现的依据。这样的类通常都是不可变的。对于那些带有可变字段的样例类,我们总是从那些不会改变的字段来计算和得出其哈希值,比如用ID字段。


    密封类

    密封类是指用sealed修饰的类。密封类的所有子类都必须在与该密封类相同的文件中定义。这样做的好处是:当你用样例类来做模式匹配时,你可以让编译器确保你已经列出了所有可能的选择,编译器可以检查模式语句的完整性。

    sealed abstract class Amount
    case class Dollar(value: Double) extends Amount
    case class Currency(value: Double, unit: String) extends Amunt
    

    上述的样例类必须与Amount类在一个文件中。


    模拟枚举

    sealed abstract class TrafficLightColor
    case object Red extends TrafficLightColor
    case object Yellow extends TrafficLightColor
    case object Green extends TrafficLightColor
    
    color match {
      case Red => "stop"
      case Yellow => "hurry up"
      case Green => "go"
    }
    

    Option类型

    标准库中的Option类型用样例类来表示那种可能存在、也可能不存在的值。样例子类Some包装了某个值,例如: Some("Fred"). 而样例对象None表示没有值。这比使用空字符串的意图更加清晰,比使用null来表示缺少的值的做法更安全。
    Option支持泛型,例如:Some("Fred") 的类型是Option[String]。
    Map的get方法返回一个Option。如果对于给定的键没有对应的值,则get返回None,如果有值,就会将该值包在Some中返回。

    scores.get("Alice") match {
      case Some(score) => println(score)
      case None => println("No score")
    }
    
    //  可以使用isEmpty 和 get 替代上面代码
    val aliceScore = scores.get("Alice")
    if (aliceScore.isEmpty) println("No score")
    else println(aliceScore.get)
    
    // 使用更简便的 getOrElse方法
    println(aliceScore.getOrElse("No score"))
    

    偏函数

    被包在花括号内的一组case语句是一个偏函数----一个并非对所有输入值都有定义的函数。它是PartialFunction[A, B]类的一个实例。其中A是参数类型,B是返回类型。该类有两个方法:apply从匹配到的模式计算函数值, 而isDefinedAt方法在输入至少匹配其中一个模式时返回true。

    val f: PartialFunction[Char, Int] = { case '+' => 1; case '-' => -1 }
    f('-')   // 调用 f.apply('-'), 返回-1
    f.isDefinedAt('0')  // fase
    f('0')  // 抛出MatchError
    

    有一些方法接受PartialFunction作为参数。例如 GenTraversable特质的collect方法将一个偏函数应用到所有该偏函数有定义的元素,并返回包含这些结果的序列:

    "-3+4".collect {case '+' => 1;  case '-' => -1 }  // Vector(-1, 1)
    
    PartialFun.png

    相关文章

      网友评论

          本文标题:快学Scala第14章----模式匹配和样例类

          本文链接:https://www.haomeiwen.com/subject/vysfjttx.html