美文网首页
SparseArray

SparseArray

作者: JunL_Dev | 来源:发表于2020-02-16 10:17 被阅读0次
    Start

    前言

    概括的说,SparseArray<E> 是用于在 Android 平台上替代 HashMap 的数据结构,更具体的说,是用于替代 key 为 int 类型,value 为 Object 类型的 HashMap。和 ArrayMap 类似,它的实现相比于 HashMap 更加节省空间,而且由于 key 指定为 int 类型,也可以节省 int-Integer 的装箱拆箱操作带来的性能消耗。

    1. SparseArray 概要

    它仅仅实现了 implements Cloneable 接口,所以使用时不能用 Map 作为声明类型来使用。

    它也是线程不安全的,允许 value 为 null。

    从原理上说,它的内部实现也是基于两个数组。
    一个 int[] 数组mKeys,用于保存每个 item 的 key,key 本身就是 int 类型,所以可以理解 hashCode 值就是 key 的值。一个 Object[] 数组 mValues,保存 value。容量和 key 数组的一样。

    类似 ArrayMap ,它扩容的更合适,扩容时只需要数组拷贝工作,不需要重建哈希表。

    同样它不适合大容量的数据存储。存储大量数据时,它的性能将退化至少 50%。

    比传统的 HashMap 时间效率低。因为其会对 key 从小到大排序,使用二分法查询 key 对应在数组中的下标。在添加、删除、查找数据的时候都是先使用二分查找法得到相应的 index,然后通过 index 来进行添加、查找、删除等操作。

    所以其是按照 key 的大小排序存储的。

    另外,SparseArray 为了提升性能,在删除操作时做了一些优化:当删除一个元素时,并不是立即从 value 数组中删除它,并压缩数组,而是将其在 value 数组中标记为已删除。这样当存储相同的 key 的 value 时,可以重用这个空间。如果该空间没有被重用,随后将在合适的时机里执行 gc(垃圾收集)操作,将数组压缩,以免浪费空间。

    适用场景:

    • 数据量不大(千以内)
    • 空间比时间重要
    • 需要使用 Map,且 key 为 int 类型。

    示例代码:

            SparseArray<String> stringSparseArray = new SparseArray<>();
            stringSparseArray.put(1,"a");
            stringSparseArray.put(5,"e");
            stringSparseArray.put(4,"d");
            stringSparseArray.put(10,"h");
            stringSparseArray.put(2,null);
    
            Log.d(TAG, "onCreate() called with: stringSparseArray = [" + stringSparseArray + "]");
    

    输出:

    //可以看出是按照 key 排序的
    onCreate() called with: stringSparseArray = [{1=a, 2=null, 4=d, 5=e, 10=h}]
    

    2. 构造方法

        //用于标记value数组,作为已经删除的标记
        private static final Object DELETED = new Object();
        //是否需要GC 
        private boolean mGarbage = false;
    
        //存储key 的数组
        private int[] mKeys;
        //存储value 的数组
        private Object[] mValues;
        //集合大小
        private int mSize;
    
        //默认构造函数,初始化容量为10
        public SparseArray() {
            this(10);
        }
        //指定初始容量
        public SparseArray(int initialCapacity) {
            //初始容量为0的话,就赋值两个轻量级的引用
            if (initialCapacity == 0) {
                mKeys = EmptyArray.INT;
                mValues = EmptyArray.OBJECT;
            } else {
            //初始化对应长度的数组
                mValues = ArrayUtils.newUnpaddedObjectArray(initialCapacity);
                mKeys = new int[mValues.length];
            }
            //集合大小为0
            mSize = 0;
        }
    

    关注一下几个变量:

    • 底层数据结构为 int[] 和 Object[] 类型数组。
    • mGarbage: 是否需要 GC
    • DELETED: 用于标记 value 数组,作为已经删除的标记

    3. 单个增、改

        public void put(int key, E value) {
            //利用二分查找,找到 待插入key 的 下标index
            int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
            //如果返回的index是正数,说明之前这个key存在,直接覆盖value即可
            if (i >= 0) {
                mValues[i] = value;
            } else {
                //若返回的index是负数,说明 key不存在.
    
                //先对返回的i取反,得到应该插入的位置i
                i = ~I;
                //如果i没有越界,且对应位置是已删除的标记,则复用这个空间
                if (i < mSize && mValues[i] == DELETED) {
                //赋值后,返回
                    mKeys[i] = key;
                    mValues[i] = value;
                    return;
                }
    
                //如果需要GC,且需要扩容
                if (mGarbage && mSize >= mKeys.length) {
                    //先触发GC
                    gc();
                    //gc后,下标i可能发生变化,所以再次用二分查找找到应该插入的位置i
                    // Search again because indices may have changed.
                    i = ~ContainerHelpers.binarySearch(mKeys, mSize, key);
                }
                //插入key(可能需要扩容)
                mKeys = GrowingArrayUtils.insert(mKeys, mSize, i, key);
                //插入value(可能需要扩容)
                mValues = GrowingArrayUtils.insert(mValues, mSize, i, value);
                //集合大小递增
                mSize++;
            }
        }
        //二分查找 基础知识不再详解
        static int binarySearch(int[] array, int size, int value) {
            int lo = 0;
            int hi = size - 1;
    
            while (lo <= hi) {
                //关注一下高效位运算
                final int mid = (lo + hi) >>> 1;
                final int midVal = array[mid];
    
                if (midVal < value) {
                    lo = mid + 1;
                } else if (midVal > value) {
                    hi = mid - 1;
                } else {
                    return mid;  // value found
                }
            }
            //若没找到,则lo是value应该插入的位置,是一个正数。对这个正数去反,返回负数回去
            return ~lo;  // value not present
        }
    
        //垃圾回收函数,压缩数组
        private void gc() {
            //保存GC前的集合大小
            int n = mSize;
            //既是下标index,又是GC后的集合大小
            int o = 0;
            int[] keys = mKeys;
            Object[] values = mValues;
            //遍历values集合,以下算法 意义为 从values数组中,删除所有值为DELETED的元素
            for (int i = 0; i < n; i++) {
                Object val = values[I];
                //如果当前value 没有被标记为已删除
                if (val != DELETED) {
                    //压缩keys、values数组
                    if (i != o) {
                        keys[o] = keys[I];
                        values[o] = val;
                        //并将当前元素置空,防止内存泄漏
                        values[i] = null;
                    }
                    //递增o
                    o++;
                }
            }
            //修改 标识,不需要GC
            mGarbage = false;
            //更新集合大小
            mSize = o;
        }
    

    看一下 GrowingArrayUtils.insert 的代码:

    public static int[] insert(int[] array, int currentSize, int index, int element) {        
      //断言 确认 当前集合长度 小于等于 array数组长度        
      assert currentSize <= array.length;        
      //如果不需要扩容       
      if (currentSize + 1 <= array.length) {            
        //将array数组内元素,从index开始 后移一位            
        System.arraycopy(array, index, array, index + 1, currentSize - index);           
        //在index处赋值            
        array[index] = element;            
        //返回            
        return array;        
      }        
      //需要扩容        
      //构建新的数组       
      int[] newArray = new int[growSize(currentSize)];        
      //将原数组中index之前的数据复制到新数组中        
      System.arraycopy(array, 0, newArray, 0, index);        
      //在index处赋值        
      newArray[index] = element;        
      //将原数组中index及其之后的数据赋值到新数组中        
      System.arraycopy(array, index, newArray, index + 1, array.length - index);        
      //返回        
      return newArray;    
    }    
    
    //根据现在的size 返回合适的扩容后的容量    
    public static int growSize(int currentSize) {        
      //如果当前size 小于等于4,则返回8, 否则返回当前size的两倍        
      return currentSize <= 4 ? 8 : currentSize * 2;    
    }
    
    • 二分查找,若未找到返回下标时,与 JDK 里的实现不同,JDK 是返回 return -(low + 1); // key not found.,而这里是对低位去反 返回。这样在函数调用处,根据返回值的正负,可以判断是否找到 index。对负 index 取反,即可得到应该插入的位置。

    • 扩容时,当前容量小于等于 4,则扩容后容量为 8。否则为当前容量的两倍。和 ArrayList,ArrayMap 不同(扩容一半),和 Vector 相同(扩容一倍)。

    • 扩容操作依然是用数组的复制、覆盖完成。类似 ArrayList.

    4. 删除

    4.1 按照key删除
        //按照key删除
        public void remove(int key) {
            delete(key);
        }
    
        public void delete(int key) {
            //二分查找得到要删除的key所在index
            int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
            //如果>=0,表示存在
            if (i >= 0) {
                //修改values数组对应位置为已删除的标志DELETED
                if (mValues[i] != DELETED) {
                    mValues[i] = DELETED; 
                    //并修改 mGarbage ,表示稍后需要GC
                    mGarbage = true;
                }
            }
        }
    
    4.2 按照index删除
        public void removeAt(int index) {
            //根据index直接索引到对应位置 执行删除操作
            if (mValues[index] != DELETED) {
                mValues[index] = DELETED;
                mGarbage = true;
            }
        }
    
    4.3 批量删除
        public void removeAtRange(int index, int size) {
        //越界修正
            final int end = Math.min(mSize, index + size);
            //for循环 执行单个删除操作
            for (int i = index; i < end; i++) {
                removeAt(i);
            }
        }
    

    5. 查询

    5.1 按照key查询
        //按照key查询,如果key不存在,返回null
        public E get(int key) {
            return get(key, null);
        }
    
        //按照key查询,如果key不存在,返回valueIfKeyNotFound
        public E get(int key, E valueIfKeyNotFound) {
            //二分查找到 key 所在的index
            int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
            //不存在
            if (i < 0 || mValues[i] == DELETED) {
                return valueIfKeyNotFound;
            } else {//存在
                return (E) mValues[I];
            }
        }
    
    5.2 按照 index 查询
        public int keyAt(int index) {
        //按照下标查询时,需要考虑是否先GC
            if (mGarbage) {
                gc();
            }
    
            return mKeys[index];
        }
    
        public E valueAt(int index) {
         //按照下标查询时,需要考虑是否先GC
            if (mGarbage) {
                gc();
            }
    
            return (E) mValues[index];
        }
    
    5.3 查询下标
        public int indexOfKey(int key) {
         //查询下标时,也需要考虑是否先GC
            if (mGarbage) {
                gc();
            }
            //二分查找返回 对应的下标 ,可能是负数
            return ContainerHelpers.binarySearch(mKeys, mSize, key);
        }
        public int indexOfValue(E value) {
         //查询下标时,也需要考虑是否先GC
            if (mGarbage) {
                gc();
            }
            //不像key一样使用的二分查找。是直接线性遍历去比较,而且不像其他集合类使用equals比较,这里直接使用的 ==
            //如果有多个key 对应同一个value,则这里只会返回一个更靠前的index
            for (int i = 0; i < mSize; I++)
                if (mValues[i] == value)
                    return I;
    
            return -1;
        }
    
    • 按照 value 查询下标时,不像 key 一样使用的二分查找。是直接线性遍历去比较,而且不像其他集合类使用 equals 比较,这里直接使用的 ==。

    • 如果有多个 key 对应同一个 value,则这里只会返回一个更靠前的 index。

    转载至:https://juejin.im/post/59f029e5f265da430e4e5d62

    申明:开始结束的图片来源网络,侵删

    End

    相关文章

      网友评论

          本文标题:SparseArray

          本文链接:https://www.haomeiwen.com/subject/zfyagctx.html