Android中的数据结构

作者: Jerry2015 | 来源:发表于2017-08-23 02:26 被阅读184次

什么是数据结构？

简单说就是以某种方式把一堆数据组织起来。通常不同的组织方式会有不同的特性。Java中常见的数据结构有：数组、链表、List、Map等等。

为什么会有这么多数据结构？

不同的数据结构形式通常都有各自的使用场景。比如常见的ArrayList。使用ArrayList你可以方便添加和移除数据。但如果看过ArrayList源码的话会知道ArrayList底层还是使用数组。那为什么还要用ArrayList？严格来说Java最底层提供的数据结构方式只有基本类型、引用类型和数组。其他任何类型都是由这些基本的数据结构封装起来的，或者说其他任何Java数据结构，一层层往下拆最终都会变成这几个。比如ArrayList就是从数组封装过来的。那问题来了，数组能做到，那为什么还要用ArrayList？主要是因为ArrayList进行增删改查使用起来非常方便，但数组处理起来就要复杂多了。所以把这些常用的需求封装起来就出现了ArrayList。

List

大家在使用List的时候可能通常都会写下面这样的代码

List<String> list = new ArrayList<>();

Java中List是个接口，所以需要用它的实现类来实例化。那当你写下上面代码的时候有没有思考过一个问题，为什么要用ArrayList。Java里有没有其他的List实现类？当然有。AndroidStudio或者Intelij Idea可以找到List实现类，然后通过Ctrl+H看到所有的继承自List的类和接口。你可能会看到非常多，但比较常用的主要就是ArrayList，LinkedList和Vector。这三个都是List实现类。有没有想过一个问题，如果你需要用到List了，那么究竟应该用什么哪个类？就比如你写了一个RecyclerView的Adapter。有Adapter就一定会需要有个数据源。这时候应该选哪个实现类？其实明白这三者区别就很容易选了。

ArrayList内部实现是个数组、有序存储。数组大家都知道长度不可变，那么append数据消耗可能会比较大，因为可能会需要resize，如果是insert或者remove数据消耗就会比较大，因为需要数组拷贝。但是get速度非常快，因为可以直接找到对应位置。

    private static List<String> add0(String[] array) {
        List<String> list = new ArrayList<>();
        for (String s : array) {
            list.add(s);
        }
        return list;
    }
    private static List<String> add1(String[] array) {
        List<String> list = new ArrayList<>();
        list.addAll(Arrays.asList(array));
        return list;
    }

    private static void remove0(List<String> list, int index, int count) {
        for (int i = 0; i < count; i++) {
            list.remove(index + i);
        }
    }

    private static void remove1(List<String> list, int index, int count) {
        list.subList(index, index + count).clear();
    }

add0和add1哪个写法好？remove0和remove1哪个写法好？add0一个个把数据add到ArrayList，最多ArrayList可能会发生array.length次数组resize。但是add1就最多只会发生一次数组resize。remove0和remove1也是一样。

LinkedList 看名字就知道这是一个链表实现的List，内部不再有数组。那么对于链表来说添加数据就是打开链条，接上链条，再锁上链条的过程。如果是频发插入数据，比如数据从1条连续插入到10万条，效率可以认为是一样。但是要get数据就比较坑了，通过index并不能直接定位到数据，所以就需要遍历数据了。remove数据也一样，只要任何是设计到index的操作效率都会比较低，除了头和尾，因为LinkedList针对头尾做了缓存。
Vector 平时见的会非常少，它内部实现也是用数组，但跟ArrayList不同的是它是线程安全的，你会发现它方法有synchronized关键字。除了这点其他特性可以认为是等同于ArrayList。

好，又回到前面老问题，RecyclerView的Adapter应该用什么数据结构？我们思考下Adapter的应用场景。通常Adapter不会非常频繁的添加数据，每次滑过RecyclerView都会触发onBindViewHolder，要bind就一定需要从数据源通过index取数据出来，取操作会比较频繁，那我们肯定不能用LinkedList了（但其实考虑到RecyclerView显示数据都是连续的，所以如果用链表来访问临近数据效率反而会更高），又因为Adapter基本上不会出现要去子线程操作数据源的情况。所以也不需要线程安全。剩下的就当然是ArrayList了，而且ArrayList取效率本来就非常高，完全符合需求。

Map

Map是一个键值对数据结构。Map的实现类也非常多，但主要是：HashMap、LinkedHashMap，TreeMap，HashTable，Android里又加了ArrayMap和SparseArray。Map跟List不一样的是不光能存数据了，还能额外多保存一个key。那有个问题，假如我新建一个下面这样的Data类。然后把所有键值对通过Data对象保存到List里，那我不是一样实现了键值对保存吗？

   public class Data<K,V>{
        private K mKey;
        private V mValue;

        public Data(K key, V value) {
            mKey = key;
            mValue = value;
        }

        public K getKey() {
            return mKey;
        }

        public void setKey(K key) {
            mKey = key;
        }

        public V getValue() {
            return mValue;
        }

        public void setValue(V value) {
            mValue = value;
        }
    }

那我为什么要用各种Map实现类呢？还是同样的问题，虽然功能上确实能实现但是效率上不同的实现方式差别会非常大。

HashMap
大家写Map可能绝大部分情况下都是使用HashMap。HashMap底层是通过数组加链表（Java1.8新加了红黑树）来实现。为什么要搞这么复杂呢？又是数组又是链表又是树的？其实还是为了提高效率。上面的把键值对封装成Data，加到List中。get效率跟HashMap比就会非常惨了。因为get只能一个个去遍历，但是HashMap就可以通过key的hashcode非常高效的get数据。
LinkedHashMap
看名字就知道多了个Linked，意思就是排序。LinkedHashMap本身就是继承自HashMap，所以增删改查方面和HashMap基本是一致的。区别主要就是通过entrySet遍历了。LinkedHashMap会保存元素的添加顺序然后按顺序遍历，但HashMap就是无序了。
TreeMap
TreeMap内部是个红黑树。从使用角度来看，它跟LinkedHashMap主要区别就LinkedHashMap保存的是元素的插入顺序，而TreeMap则是对key排序。遍历可以得到一个按key排序的结果。
HashTable
内部是个链表，另外就是线程同步。
SparseArray
SparseArray内部依然是使用数组来实现。但是限制了key只能int，而且没有装箱，HashMap的key只能是Integer。所以Sparse性能会更好，它内部做了数据压缩，来稀疏数组的数据，节省内存。
ArrayMap
ArrayMap内部也是使用数组。查找数据会通过二分法来提高效率，Google推荐用ArrayMap来代替HashMap。

网友评论

本文标题：Android中的数据结构

本文链接：https://www.haomeiwen.com/subject/pdirdxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！