美文网首页scala数据乐园程序员
Scala学习笔记(八) 模式匹配

Scala学习笔记(八) 模式匹配

作者: fengzhizi715 | 来源:发表于2017-05-15 12:18 被阅读0次

    1. 模式匹配简介

    模式匹配是 Scala 的重要特性之一,前面两篇笔记Scala学习笔记(六) Scala的偏函数和偏应用函数Scala学习笔记(七) Sealed Class 和 Enumeration都是为了这一篇而铺垫准备的。

    在jdk1.7之前,Java的 switch 关键字只可以处理原生类型(int 、short 、byte 、char)和枚举类型。在jdk1.7以后,switch新增了对String类型的处理。Scala 虽然没有switch关键词,但是它的模式匹配可以看做是 switch 的加强版,能够处理更加复杂的类型和场景。

    先来看一个简单的例子。

    scala> def judgeGrade(name:String,grade:String) {
         |   grade match {
         |     case "A" => println(name+", you are excellecnt")
         |     case "B" => println(name+", you are good")
         |     case "C" => println(name+", you are just so so")
         |     case _ if name == "Tony" => println(name+", you are a good boy,come on")
         |     case _ => println("you need to work harder")
         |   }
         | }
    judgeGrade: (name: String, grade: String)Unit
    
    scala> judgeGrade("Monica","A")
    Monica, you are excellecnt
    
    scala> judgeGrade("Lily","B")
    Lily, you are good
    
    scala> judgeGrade("Tom","C")
    Tom, you are just so so
    
    scala> judgeGrade("Tony","D")
    Tony, you are a good boy,come on
    
    scala> judgeGrade("Jacky","D")
    you need to work harder
    

    通过这个例子,可以看到模式匹配的语法大致是这样的。

    变量 match { 
      case 值1 => 代码
      case 值2 => 代码
      ...
      case 值N if (...) => 代码
      case _ => 代码
    }
    

    注意,case后面的值1到值N,可以是相同类型也可以是不同类型的。
    if (...) 是守卫条件,后面的例子会看到。
    在最后一行指令中_是一个通配符,它保证了我们可以处理所有的情况。否则当传进一个不能被匹配的值的时候,你将获得一个运行时错误。

    2. 模式匹配类型

    Scala的模式匹配可以支持常量模式、变量模式、序列模式、元组模式、变量绑定模式等等。

    2.1常量匹配

    case 后面的值是常量。

    scala> def matchConstant(x:Any) = x match {
         |   case 1 => "One"
         |   case "two" => "Two"
         |   case "3" => "Three"
         |   case true => "True"
         |   case null => "null value"
         |   case Nil => "empty list"
         |   case _ => "other value"
         | }
    matchConstant: (x: Any)String
    
    scala> println(matchConstant(1))
    One
    
    scala> println(matchConstant(true))
    True
    
    scala> println(matchConstant(null))
    null value
    
    scala> println(matchConstant(List()))  //匹配到Nil
    empty list
    
    scala> println(matchConstant(false))
    other value
    

    特别需要注意的是,Nil是一个空的List,定义为List[Nothing]。iOS开发者会比较熟悉Nil,但是这里的Nil跟OC中的Nil是两个完全不同的概念。

    2.2 变量匹配

    case 后面的值是变量

    scala> def matchVariable(x:Any) = x match {
         |    case x if(x==1) => x
         |    case x if(x=="Tony") => x
         |    case x:String => "other value:" + x
         |    case _ => "unexpected value:"+x
         | }
    matchVariable: (x: Any)Any
    
    scala> println(matchVariable(1))
    1
    
    scala> println(matchVariable("Tony"))
    Tony
    
    scala> println(matchVariable("Scala"))
    other value:Scala
    
    scala> println(matchVariable(2))
    unexpected value:2
    

    2.3 序列匹配

    case 后面的值是数组、List、Range等集合。

    scala> def matchSeq(x:Any) = x match {
         |    case List("Tony",_,_*) => "Tony is in the list"
         |    case List(_,second,_*) => "The second is:"+second
         |    case Array(first,second,_*) => "first:"+first+",second:"+second
         |    case _ => "Other seq"
         | }
    matchSeq: (x: Any)String
    
    scala> val list1 = List("Tony","Cafei","Aaron")
    list1: List[String] = List(Tony, Cafei, Aaron)
    
    scala> val list2 = "android"::"iOS"::"H5"::Nil
    list2: List[String] = List(android, iOS, H5)
    
    scala> val array1 = Array("Hadoop","Spark","ES")
    array1: Array[String] = Array(Hadoop, Spark, ES)
    
    scala> val array2 = Array("Scala")
    array2: Array[String] = Array(Scala)
    
    scala> println(matchSeq(list1))
    Tony is in the list
    
    scala> println(matchSeq(list2))
    The second is:iOS
    
    scala> println(matchSeq(array1))
    first:Hadoop,second:Spark
    
    scala> println(matchSeq(array2))
    Other seq
    

    需要注意的是,

    val list2 = "android"::"iOS"::"H5"::Nil
    

    看上去很奇怪,其实等价于

    val list2 = List("android","iOS","H5")
    

    list分为head和tail两个部分,head是list的第一个元素,tail是list中除了head外的其余元素组成的list。用::连接list时,尾节点要声明成Nil。

    所以呢,在case后面可以使用::的形式,例如:

    scala> def matchSeq2(x:Any) = x match {
         |   case x::y::Nil => x+" "+y
         |   case _ => "Something else"
         | }
    matchSeq2: (x: Any)String
    
    scala> val list3 = List(1,2)
    list3: List[Int] = List(1, 2)
    
    scala> println(matchSeq2(list2))
    Something else
    
    scala> println(matchSeq2(list3))
    1 2 
    

    2.4 元组匹配

    case 后面的值是元组类型。

    scala> def matchTuple(x:Any) = x match {
         |    case (first,_,_) => first
         |    case _ => "Something else"
         | }
    matchTuple: (x: Any)Any
    
    scala> val t = ("Tony","Cafei","Aaron")
    t: (String, String, String) = (Tony,Cafei,Aaron)
    
    scala> println(matchTuple(t))
    Tony
    

    值得注意的是,在元组模式中不能使用_*来匹配剩余的元素,_*只适用于序列模式。

    2.5 类型匹配

    它可以匹配输入待匹配变量的类型。

    scala> def matchType(x:Any) = x match {
         |   case s:String => "the string length is:"+s.length
         |   case m:Map[_,_] => "the map size is:"+m.size
         |   case _:Int | _:Double => "the number is:"+x
         |   case _ => "unexpected value:"+x
         | }
    matchType: (x: Any)String
    
    scala> println(matchType("test"))
    the string length is:4
    
    scala> println(matchType(1))
    the number is:1
    
    scala> println(matchType(1.0d))
    the number is:1.0
    
    scala> println(matchType(true))
    unexpected value:true
    
    scala> val map = Map("one"->1,"two"->2,"three"->3)
    map: scala.collection.immutable.Map[String,Int] = Map(one -> 1, two -> 2, three -> 3)
    
    scala> println(matchType(map))
    the map size is:3
    

    在这里,case 子句支持"或"逻辑,使用|即可。
    如果上述代码使用Java来改写的话,需要不断地使用instanceof来做判断类型。

    类型擦除(Type erasure)

    上面的类型模式示例中的Map部分,其实只是匹配了该变量是否为Map类型,并没有匹配其中的key和value的类型。如果同时需要匹配精确的key和value的类型的话,例如下面代码中匹配key和value都是Int类型的Map,会提示警告。

    scala> def isIntIntMap(x: Any) = x match {
         |   case m: Map[Int, Int] => true
         |   case _ => false
         | }
    <console>:12: warning: non-variable type argument Int in type pattern scala.collection.immutable.Map[Int,Int] (the underlying of Map[Int,Int]) is unchecked since it is eliminated by erasure
             case m: Map[Int, Int] => true
                     ^
    isIntIntMap: (x: Any)Boolean
    

    由于Scala 使用了泛型的类型擦除模式,代码在运行时会将类型参数忽略掉。所以上面的代码在运行时并不能去判断当前Map对象的key和value类型是否为Int或其他类型。

    scala> isIntIntMap(Map(1->1))
    res10: Boolean = true
    
    scala> isIntIntMap(Map("string"->"value"))
    res11: Boolean = true
    

    但是Array不会类型擦除,可以指定Array对象中元素的类型。

    2.6 变量绑定匹配

    可以将匹配的对象绑定到变量上。首先写一个变量名,然后写一个@符号,最后写入该匹配的对象。如果匹配成功,则将变量设置为匹配的对象。

    scala> case class Person(name: String, age: Int)
    defined class Person
    
    scala> val person = Person("Tony",18)
    person: Person = Person(Tony,18)
    
    scala> person match {
         |   case p @Person(_,age) => println(s"${p.name},age is $age")
         |   case _ => println("Not a person")
         | }
    Tony,age is 18
    

    3. 模式匹配和Case Class

    Case Class在Scala学习笔记(四) 类的初步中有提到。

    3.1构造器模式匹配

    case 后面的值是类构造器。

    scala> case class Person(name:String,age:Int)
    defined class Person
    
    scala> val tony = Person("Tony",18)
    tony: Person = Person(Tony,18)
    
    scala> val monica = Person("Monica",15)
    monica: Person = Person(Monica,15)
    
    scala> val tom = Person("Tom",20)
    tom: Person = Person(Tom,20)
    
    scala> def matchConstructor(x:Any) = x match {
         |    case Person("Tony",18) => println("Hi Tony")
         |    case Person("Monica",15)=> println("Hi Monica")
         |    case Person(name,age) => println(s"Who are you,$age year-old person named $name?")
         | }
    matchConstructor: (x: Any)Unit
    
    scala> matchConstructor(tony)
    Hi Tony
    
    scala> matchConstructor(monica)
    Hi Monica
    
    scala> matchConstructor(tom)
    Who are you,20 year-old person named Tom?
    

    如果在类中声明了与该类相同的名字的 object 则该object 是该类的“伴生对象”。伴生对象有一个apply()用于构造对象,跟apply()对偶的是unapply()用于提取和“解构”。上面例子的匹配,就是用了Person.unapply(...)。

    Person类是case class,创建时就帮我们实现了一个伴生对象,这个伴生对象里定义了apply()和unapply()。

    3.2 Sealed Class的模式匹配

    使用Sealed Class能保证所有的匹配情况都列举出来。
    其实,在Scala学习笔记(七) Sealed Class 和 Enumeration中,已经提到了Sealed Class的模式匹配

    4.模式匹配的其他用法

    模式匹配并不仅仅局限于case语句。在定义变量时,也可以使用模式匹配。
    例如:

    scala> val (x,y) = (1,2)
    x: Int = 1
    y: Int = 2
    

    4.1 for循环中使用

    foreach方法

    scala> for (i<-List("Java","Scala","Kotlin","Groovy"))
         |    println(i)
    Java
    Scala
    Kotlin
    Groovy
    

    变量绑定,相当于给Scala设置别名index

    scala> for(index@"Scala" <- List("Java","Scala","Kotlin","Groovy"))
         |   println(index)
    Scala
    

    条件表达格式

    scala> for((language,"Hadoop") <- Set("Scala" -> "Spark","Java" -> "Hadoop")){
         |   println(language)
         | }
    Java
    

    4.2 正则表达式中使用

    scala> val pattern="(S|s)cala".r
    pattern: scala.util.matching.Regex = (S|s)cala
    
    scala> val str="Scala is scalable and cool language"
    str: String = Scala is scalable and cool language
    
    scala> println(pattern findFirstIn str)
    Some(Scala)
    
    scala> println((pattern findAllIn str).mkString(", "))
    Scala, scala
    
    scala> println(pattern replaceFirstIn(str, "Java"))
    Java is scalable and cool language
    

    Scala 的正则表达式就是提取器,Scala会把每个括号里的匹配都展开到一个模式变量里。比如"(S|s)cala".r有一个unapply()方法,它返回Option[String]。另一方面"(S|s)(cala)".r的unapply会返回Option[String,String]。

    
    scala> val numitemPattern="""([0-9]+) ([a-z]+)""".r
    numitemPattern: scala.util.matching.Regex = ([0-9]+) ([a-z]+)
    
    scala> val line="9527 scala"
    line: String = 9527 scala
    
    scala> line match{
         |       case numitemPattern(num,blog)=> println(num+"\t"+blog)
         |       case _=>println("hahaha...")
         |     }
    9527    scala
    

    4.3 异常处理中使用

    Scala 抛出异常的语法和 Java 中的抛出异常语法是一致的。
    但是Scala 的try...catch语句和 Java 的有些不一样,catch语句中通过case语句来捕获对应的异常。

    catch {
      case e: IllegalArgumentException => println("illegal arg. exception");
      case e: IllegalStateException    => println("illegal state exception");
      case e: IOException              => println("IO exception");
    }
    

    再结合一下final语句。

    try {
      throwsException();
    } catch {
      case e: IllegalArgumentException => println("illegal arg. exception");
      case e: IllegalStateException    => println("illegal state exception");
      case e: IOException              => println("IO exception");
    } finally {
      println("this code is always executed");
    }
    

    4.4 Option类中使用

    Scala 语言中包含一个标准类型 Option 类型,代表可选值。Option 类型的值有两个可能的值,一个为 Some(x) 其中 x 为有效值,另外一个为 None 对象,代表空值。

    scala> val books=Map("hadoop"->5,"spark"->6,"hbase"->7)
    books: scala.collection.immutable.Map[String,Int] = Map(hadoop -> 5, spark -> 6, hbase -> 7)
    
    scala> books.get("hadoop")
    res0: Option[Int] = Some(5)
    
    scala> books.get("hive")
    res1: Option[Int] = None
    
    scala> books.get("hive").getOrElse("No such book") // 不存在的元素则使用其默认的值
    res2: Any = No such book
    

    将 Option 类型的值放开,使用模式匹配:

    scala> def matchOption(x:Option[Int]) = x match {
         |    case Some(s) => s
         |    case None => "?"
         | }
    matchOption: (x: Option[Int])Any
    
    scala> matchOption(books.get("hadoop"))
    res3: Any = 5
    
    scala> matchOption(books.get("hive"))
    res4: Any = ?
    
    scala> 
    

    Option[T]实际上就是一个容器,可以把它看做是一个集合,只不过这个集合中要么只包含一个元素(被包装在Some中返回),要么就不存在元素(返回None)。既然是一个集合,那么可以对它使用map、foreach或者filter等方法。

    总结

    模式匹配是 Scala 区别于 Java 的重要特征。我们看到了模式匹配的各种用法,在实际开发中模式匹配也应用于各个方面。

    先前的文章:
    Scala学习笔记(七) Sealed Class 和 Enumeration
    Scala学习笔记(六) Scala的偏函数和偏应用函数

    Scala学习笔记(五) 抽象类以及类中的一些语法糖
    Scala学习笔记(四) 类的初步
    Scala学习笔记(三)
    Scala学习笔记(二)
    Scala学习笔记(一)

    相关文章

      网友评论

        本文标题:Scala学习笔记(八) 模式匹配

        本文链接:https://www.haomeiwen.com/subject/dmnegttx.html