美文网首页
《Scala 程序设计》学习笔记 Chapter 4:模式匹配

《Scala 程序设计》学习笔记 Chapter 4:模式匹配

作者: 云之外 | 来源:发表于2017-03-22 14:37 被阅读47次
    • Scala 模式匹配支持获取对象状态;获取对象状态的操作往往称为“提取”或“解构”。[P86]

    match 中的值、变量和类型

    • 可以使用一个 Any 类的变量放到最后来充当 default 。[P88]

    • 编译器会自动推断所有 case 子句返回值类型的最近公共父类型。[P88]

    • 在被匹配或提取的值中,编译器假定以大写字母开头的为类型名,以小写字母开头的为变量名。[P89]

    • 注意一下模式匹配的变量含义与作用域:[P89]

      def checkY(y: Int) = {
          for {
              x <- Seq(1, 2, 3)
          } {
              val str = x match {
                  case y => "found y!" // 错误:并不是与变量 y 的值匹配,而是声明了一个 Any 类型的 y,这样会收到系统警告。
                  case i: Int => "int: " + i
              }
              println(str)
          }
      }
      checkY(1)
      

      使用 `` 包围变量以引用已经定义的变量。

      def checkY(y: Int) = {
          for {
              x <- Seq(1, 2, 3)
          } {
              val str = x match {
                  case `y` => "found y!" // 正确
                  case i: Int => "int: " + i
              }
              println(str)
          }
      }
      checkY(1)
      
    • 逻辑或语法:case _: Int | _: Double => ...

    序列的匹配

    • 序列的基础语法 [P91]

      • 使用 .empty[A] 构造空序列。
      • 任意类型的空序列 用 Nil 表示。
    • 关于 Seq 的特殊语法:[P91 - 92]

      def seqToString[T](seq: Seq[T]): String = seq match {
          case head +: tail => s"$head +: " + seqToString(tail) // 1
          case Nil => "Nil"
      }
      
      1. +: 是“构造” 操作符,以 : 结尾的方法向右结合,即向 Seq 的尾部结合。headtailSeq 自带的两个方法,但在这里,按照惯例被解释为一个变量,作用是提取一个非空序列的头部(第一个元素)和尾部(除了第一个元素外的其他元素)。
    • Map 不是 Seq 的子类型,要通过 map.toSeq 生成 seq。[P92]

    case 中的 guard 语句 [P95]

    for ( i <- Seq(1, 2, 3, 4)) {
        i match {
            case _ if i % 2 == 0 => println(s"even: $i")
            case _ => println(s"odd: $i")
        }
    }
    

    case 类的匹配

    • 使用 Seq.zipWithIndex 方法将一个 Seq 连同序号一起打印出来:[P95 -96]

      val itemsCosts = Seq(("Pencil", 0.52), ("Paper", 1.35))
      val itemsCostsIndices = itemsCosts.zipWithIndex
      for (itemCostIndex <- itemsCostsIndices) {
          itemCostIndex match {
              case ((item, cost), index) => println(s"$index: $item costs $cost each")
          }
      }
      

      调用 zipWithIndex 返回的元组形式为 ((name, cost), index)

    unapply 方法

    • unapply 方法用于提取和解构。当在 match 中对 case 类使用诸如 case Person("Alice", 25, Address(_, "Chicago", _)) => ... 之类的语法时,会调用其 unapply 方法。(当然在本例中 Address 也需要 unapply 方法)[P96]

    • unapply 方法的一种定义:[P96 - 97]

      def unapply(P: Person): Option[Tuple3[String, Int, Address]] = 
          Some((p.name, p.age, p.address))
      
      • Option 的原因是,unapply 方法可以选择“否决”这个请求,返回 None 详见 unapplySeq

      • 从 Scala 2.11.1 开始,unapply 方法可以返回任意类型�,只要该类型具有以下方法:

        def isEmpty: Boolean
        def get: T
        
    • 有必要时,unapply 会被递归调用(比如本例中的 Address )。[P97]

    • 元组字面量语法:[P97 -> P50]

      val t1 = Option[Tuple3[String, Int, Address]] = ...
      val t2 = Option[(String, Int, Address)] = ...
      val t3 = Option[ (String, Int, Address) ] = ... // 更容易阅读
      
    • unapply 支持任意非空集合:使用 :+ [P97 - 98]

      • :+ 是一个单例对象,它的 unapply 使用以下语法:

        def unapply[T, Coll](collection: Coll): Option[(T, Coll)]
        

        但是这样的 unapply 使用的调用方法为:case +: (head, tail) => ...
        可以写成如下形式:

        def processSeq2[T](l: Seq[T]): Unit = l match {
            case +: (head, tail) => 
                println("%s +: ", head)
                processSeq2(tail)
            case Nil => println("Nil")
        }
        

        当然,也可以使用 head +: tail ,这是编译器提供的语法糖。同样的语法糖还有:

        case class With[�A, B](a: A, b: B)
        val with1: With[Stirng, Int] = With("Foo", 1)
        val with2: With[String, Int] = With("Bar", 2)
        Seq(with1, with2) foreach {
            w match { 
                case s With i => println(s"$s with $i)
                case _ => println(s"Unknown $w")
            }
        }
        

        但是,同样的语法不能用于初始化

      • 使用 :+ 逆序处理一个序列。[P99]

        def reverseSeqToString[T](l: Seq[T]): String = l match {
            case prefix :+ end => reverseSeqToString(prefix) + s" :+ $end"
            case Nil => "Nil"
        }
        
    • 补充:对于 List:+ / +: 需要 O(n) 的时间复杂度,对于 Vector 之类的其他某些序列,只需要 O(1) 的时间复杂度。[P99]

    unapplySeq 方法

    • 除了 apply 方法外,Seq 的伴随对象还实现了 unapplySeq 方法:[P100]

      def apply[A](elems: A*): Seq[A]
      def unapplySeq[A](x: Seq[A]): Some[Seq[A]]
      

      case 中,使用如下语法调用 unapplySeq

      def windows[T](seq: Seq[T]): String = seq match {
          case Seq(head1, head2, _*) => s"($head1, $head2), " +����� windows(seq.tail)
          case ...
          ...
      }
      
    • 当然也可以使用 +: 语法:[P101]

      def windows2[T](seq: Seq[T]): String = seq match {
          case head1 +: head2 +: tail => s"($head1, $head2), " +����� windows2(seq.tail)
          case ...
          ...
      }
      
    • Seqsliding 方法:[P101]

      • 返回一个“惰性”迭代器。对这个迭代器调用 toSeq 方法,可以将迭代器转为一个 collection.immutable.Stream (一个惰性列表,创建时即对列表的头部元素求值,但只在需要的时候才会对列表的尾部元素求值。toList 会在创建时对所有元素求值)。

    可变参数列表的匹配

    • 使用 name @ _* 匹配可变参数:[P102]

      case WhereIn(col, val1, vals @ _*) => ...
      

    正则表达式匹配

    • 使用 .r 方法生成正则表达式。[P103]

      val BookExtractorRE = """Book: title=([^,]+),\s+author=(.+)""".r
      

      match 中使用

      case BookExtractorRE(title, author) => ...
      
    • 使用三重引号表示正则表达式字符串的原因是可以不用对正则中的 \ 等符号单独进行转义。[P103]

    • 在三重引号内的正则表达式中使用变量插值是无效的,如果使用了变量插值,就需要对 \ 等符号进行转义操作。[P103]

    • scala.util.matching.Regex

    再谈 case 语句的变量绑定

    • name @ object 语法:[P104]

      person match {
          case p @ Person("Alice", 25, address) => ...
          case p @ Person("Bob", 29, a @ Addres(street, city, country)) => ...
      }
      

      p @ ... 的语法将整个 Person 类的实例赋值给了变量 p 。如果不需要从 Person 实例中提取属性值,只要写为 p: Person => ... 就可以了。

    再谈类型匹配

    • JVM 类型擦除:为了避免与旧版本代码断代,JVM 的字节码不会记住一个泛型实例(如 List )中实际传入的类型与参数信息。所以在 match 中,不能区分 Seq[String]Seq[Double] ,要自定义匹配函数:

      x match {
          case seq: Seq[_] => (s"seq ${doSeqMatch(seq)}", seq)
          case _ => ("Unknown!", x)
      }
      def doSeqMatch[T](seq: Seq[T]): String = seq match {
          case Nil => "Noting"
          case head +: _ => head match {
              case _: Double => "Double"
              case _: String => "String"
              case _ => "Unmatched seq element"
          }
      }
      

    封闭继承层级与全覆盖匹配

    • 如果类型的继承层级可能发生变化,就应当避免使用 sealed 。[P107]

    • 在父类型中,不带参数的抽象方法可以再子类中用 val 变量实现。推荐的做法是:在抽象父类型中声明一个不带参数的抽象方法,这样就给子类型如何具体实现该方法留下了巨大的自由,既可以用方法实现,又可以用 val 变量实现。[P107]

      sealed abstract class HttpMethod() {
          def body: String
          def bodyLength: body.length
      }
      
    • 编译器无法判断 Enumeration 相应的 match 语句是否全覆盖。[P107]

    模式匹配的其他用法

    • 定义变量:

      val Person(name, age, Address(_, state, _)) = Person("Dean", 29, Address("1 Scala Way", "CA", "USA))
      // 得到 name, age, state;
      
      val head +: tail = List(1, 2, 3)
      // head: Int = 1
      // tail: List[Int] = List(2, 3)
      
      val Seq(a, b, c) = List(1, 2, 3)
      // 得到 a, b, c
      
      val Seq(a, b, c) = List(1, 2, 3, 4) // MatchError
      
    • if 中也可以使用模式匹配,但不能用 _ 占位符。[P108]

      val p = Person("Dean", 29, Address("1 Scala Way", "CA", "USA"))
      if (p == Person("Dean", 29, Address("1 Scala Way", "CA", "USA"))) "yes" else "no" // "yes"
      
    • Scala 对一些非字母数字的字符做了”字符映射“,使得他们符合 JVM 规范。比如: = 会被映射为 $eq 。[�P108]

    • 元组:[P109]

      def sum_count(ints: Seq[Int]) = (ints.sum, ints.size)
      val (sum, count) = sum_count(List(1, 2, 3, 4, 5))
      // sum: Int = 15
      // count: Int = 5
      
    • 在带复杂参数的函数字面量中使用:[P109 - 110]

      case class Address(street: String, city: String, country: String)
      case class Person(name: String, age: Int)
      val as = Seq(
          Address("1 Scala Lane", "Anytown", "USA"),
          Address("2 Clojure Lane", "Othertown", "USA"))
      val ps = Seq(
          Person("Buck Trends", 29)
          Person("Clo Jure", 28)
      )
      val pas = ps zip as // Seq[(Person, Address)]
      pas map {
          case (Person(name, age), Address(street, city, country)) => 
              s"$name (age: $age) lives at $street, $city, in $country"
      }
      
    • 在正则表达式中使用模式匹配去解构字符串:[P110]

      val cols = """\*|[\w, ]+"""
      val table = """\w+"""
      val tail = """.*"""
      val selectRE = s"""SELECT\\s*(DISTINCT)?\\s+($cols)\\s*FROM\\s+($table)\\s*($tail)?;""".r
      
      val selectRE(distinct1, cols1, table1, otherClauses) = "SELECT DISTINCT * FROM atable;"
      /*
          distinct1: String = DISTINCT
          cols1: String = *
          table1: String = atable
          otherClauses: String = ""
      */
      
      val selectRE(distinct2, cols2, table2, otherClauses) = "SELECT col1, col2 FROM atable;"
      /*
          distinct1: String = null
          cols1: String = "col1, col2"
          table1: String = atable
          otherClauses: String = ""
      */
      

      由于使用了变量插值,在正则表达式字符串中必须增加 \ 转义。

    • 要谨慎对待默认 case 子句:什么情况下才应该出现“以上均不匹配”。[P111]

    相关文章

      网友评论

          本文标题:《Scala 程序设计》学习笔记 Chapter 4:模式匹配

          本文链接:https://www.haomeiwen.com/subject/lryonttx.html