美文网首页
Scala基本数据结构用法异于Java的部分

Scala基本数据结构用法异于Java的部分

作者: 0过把火0 | 来源:发表于2018-03-06 14:57 被阅读46次

    转载请注明出处[https://www.jianshu.com/p/116e26e668df]

    Scala中的同样实现了各种各样的基本数据结构类型,其中一些异于Java的使用方法需要特别注意。
    需要特别注意的是,Scala中的基本数据类型(list,set,map,iterator,array,tuple)由两种容器类继承而来的:
    1、scala.collection.immutable --> 不可变容器类
    2、scala.collection.mutable --> 可变容器类

    List

    Scala中,List是一种共享相同类型的不可变的对象序列。
    不同于Java的java.util.List,scala的list一旦被定义,其值就不能改变,因此声明List时需要初始化。
    (这里说的值不能变是指所指向的对象地址不能变,对象本省的值是可以发生变化!!)

    List操作符:
    ++ 从列表的尾部添加另外一个列表

    ++: 在列表的头部添加一个列表

    +: 在列表的头部添加一个元素

    :+ 在列表的尾部添加一个元素

    :: 在列表的头部添加一个元素

    Set

    集合Set是不重复元素的容器。元素按照插入顺序排序,以Hash的方法来对元素的值进行排序组织。

    Set包含可变集和不可变集,分别位于scala.collection.mutable包和scala.collection.immutable包中,缺省状况是不可变集。

    var mySet = Set("Hadoop","Spark")
    mySet += "Scala"
    

    上面代码定义了可变的var类型变量,但是Set缺省状态下是不可变集合,注意这里需要理解不可变指的是对象所开辟的空间不可变,添加了元素后相当于重新生成了新的Set在新的空间。

    如果要声明一个可变集则需要导入包:

    import scala.collection.mutable.Set
    val myMutableSet = Set("Data","BigData")  
    myMutableSet += "Cloud"
    

    上面的代码我们指定所使用的Set为可变的,但是定义变量myMutableSet 时用了val来指定其不可变,那为什么可以往里面添加新的元素呢?
    这里需要理解:不可变指的是对象所在地址不变,即指向的空间指针不变,而集合本身是可以发生变化的。

    Map

    映射Map是一系列键值对的容器。
    与Set一样,Map也分为可变与不可变,缺省默认是不可变,如需使用可变,需要导入scala.collection.mutable.Map包。
    格式:Map(key1->value1, key2->value2)
    在取出一个key所对应的value时,为了避免盲目期间,若想先判断是否key存在可以使用下面的例子来取值:

    val myMap = Map("a"->1, "b"->2)
    val r = if (myMap.contains("a")) myMap("a") else 0
    println(r)
    

    Map遍历:
    for ((k,v) <- myMap) 语句块
    例如:for ((k,v) <- myMap) printf("Code is : %s and name is %s\n",k,v) 即可遍历mySet全部的key和value。

    也可以只遍历全部的key或是value:
    for (k <- mySet.keys) println(k) 打印全部的key;
    for (v <- mySet.values) println(v) 打印全部的values

    迭代器

    Scala中,迭代器Iterator不是一个集合,但是其提供一个访问集合的方法。
    迭代器两个基本操作:next和hasNext

    如何通过迭代器访问集合内容:

    while循环来访问:
    val iter = Iterator("Hadoop", "Spark")
    while (iter.hasNext) {
        println(iter.next())
    }
    
    for循环来访问:
    val iter = Iterator("Hadoop", "Spark")
    for (elem <- iter) {
        println(elem)
    }
    

    Iterator继承自Iterable类,其类提供两个方法返回一个迭代器(这个返回的迭代器不是单个元素,而是原容器元素的全部子序列):grouped和sliding。
    groubed返回元素的增量分块;
    sliding返回一个滑动元素的窗口。

    val list1 = List(1,2,3,4,5)
    val list_g = list1 grouped 3
    list_g.next()
        -->输出:List(1,2,3)
    list_g.next()
        -->输出:List(4,5)
    
    val list_s = list1 sliding 3
    list_s.next()
        -->输出:List(1,2,3)
    list_s.next()
        -->输出:List(2,3,4)
    

    数组Array

    Array定义的数组属于定长数组,一旦初始化,不可改变。
    Scala中可以不指明初始化数组的类型,Scala可以根据数据元素自行推断元素类型:
    val intArray = Array(12,14,45)
    val strArray = array("hadoop","spark")

    Scala中定义多维数组(矩阵)的方法:
    scala Array提供了函数ofDim来定义二维和三维数组,用法如下:
    val myMatrix = Array.ofDim[int](3,4) 等同于Array[Array[int]]

    如果要定义变长Array,可使用ArrayBuffer类型:

    import scala.collection.mutable.ArrayBuffer
    val arr = ArrayBuffer(10,20,30)
    arr += 40
    arr.insert(2,60,40)    //从第二个元素后面插入60和40
    arr -= 40   //把第一个为40的值删掉
    var temp = arr.remove(2)
    

    元组 Tuple

    元组是不同类型的值的聚集。元组和List不同,列表中各个元素必须是相同类型,而元组可以包含不同类型元素。注意取出一个元素的方法是 下划线.num

    val tu = ("bigdata","hadoop","spark")
    println(tu._1)
        ->输出"bigdata"
    println(tu._2)
        -->输出"hadoop"
    

    相关文章

      网友评论

          本文标题:Scala基本数据结构用法异于Java的部分

          本文链接:https://www.haomeiwen.com/subject/alwhfftx.html