Arrays源码阅读

作者: 丶time | 来源:发表于2018-04-22 09:42 被阅读0次

    Arrays源码阅读

    提供了排序,并行排序,二分查找,范围填充,相等比较,深度比较等方法,深入理解一下实现方法

    私有属性:

    MIN_ARRAY_SORT_GRAN
     private static final int MIN_ARRAY_SORT_GRAN = 1 << 13;
    
    

    当数组长度小于MIN_ARRAY_SORT_GRAN将不会执行并行排序算法,源码注释中说原因是因为长度太小,划分任务也会很小,会导致内存争用,反而不会加速,所以设置一个阈值。


    NaturalOrder
    static final class NaturalOrder implements Comparator<Object> {
            @SuppressWarnings("unchecked")
            public int compare(Object first, Object second) {
                return ((Comparable<Object>)first).compareTo(second);
            }
            static final NaturalOrder INSTANCE = new NaturalOrder();
        }
    
    

    一个用于自然排序的静态内部类,实现了Comparator接口,重写了compare方法,在方法中对比较类型进行了Comparable类型强转,调用了Comparable接口的compareTo方法,要求比较的对象实现Comparable接口

    LegacyMergeSort
    static final class LegacyMergeSort {
        private static final boolean userRequested =
            java.security.AccessController.doPrivileged(
                new sun.security.action.GetBooleanAction(
                    "java.util.Arrays.useLegacyMergeSort")).booleanValue();
    }
    
    

    安全检查,若用户自己确定可以比较大小,则userRequested为true。这个类未来会被弃用,若未使用,不推荐使用。不过可以到时候看看安全检查的细节//TODO

    INSERTIONSORT_THRESHOLD
      private static final int INSERTIONSORT_THRESHOLD = 7;
    
    

    若元素数量小于7,则采用插入算法

    ArrayList
    private static class ArrayList<E> extends AbstractList<E>
            implements RandomAccess, java.io.Serializable
    
    

    这是调用asList()后得到的就是这个类,一个只读的类,不是util.Arraylist。

    方法

    sort
    • 基本类型
        public static void sort(int[] a) {
            DualPivotQuicksort.sort(a, 0, a.length - 1, null, 0, 0);
        }
    
        public static void sort(int[] a, int fromIndex, int toIndex) {
            rangeCheck(a.length, fromIndex, toIndex);
            DualPivotQuicksort.sort(a, fromIndex, toIndex - 1, null, 0, 0);
        }
    
    

    sort底层调用DualPivotQuicksort,双轴快排,一个优化了排序方法,根据元素数量或是归并分组长度和数量,选择优化过的成对插入排序,双轴快排或归并算法。

    sort支持int,short,long,char,byte,float,double,自定义类型数组。

    [fromIndex,toIndex)左闭右开

    • 自定义类型
        public static void sort(Object[] a) {
            if (LegacyMergeSort.userRequested)
                legacyMergeSort(a);
            else
                ComparableTimSort.sort(a, 0, a.length, null, 0, 0);
        }
        public static void sort(Object[] a, int fromIndex, int toIndex) {
            rangeCheck(a.length, fromIndex, toIndex);
            if (LegacyMergeSort.userRequested)
                legacyMergeSort(a, fromIndex, toIndex);
            else
                ComparableTimSort.sort(a, fromIndex, toIndex, null, 0, 0);
        } 
    
    

    安全检查,legacyMergeSort(a):底层调用归并排序,若递归中,若元素小于INSERTIONSORT_THRESHOLD,则直接插入排序

    若没有,调用ComparableTimSort.sort,一个优化过的归并排序,考虑了最坏情况,并且与插入排序混合使用。

        public static <T> void sort(T[] a, Comparator<? super T> c) {
        if (c == null) {
            sort(a);
        } else {
            if (LegacyMergeSort.userRequested)
                legacyMergeSort(a, c);
            else
                TimSort.sort(a, 0, a.length, c, null, 0, 0);
        }
    }
     public static <T> void sort(T[] a, int fromIndex, int toIndex,
                                    Comparator<? super T> c) {
            if (c == null) {
                sort(a, fromIndex, toIndex);
            } else {
                rangeCheck(a.length, fromIndex, toIndex);
                if (LegacyMergeSort.userRequested)
                    legacyMergeSort(a, fromIndex, toIndex, c);
                else
                    TimSort.sort(a, fromIndex, toIndex, c, null, 0, 0);
            }
        }
    
    

    和上面类似


    parallelSort 并行排序

    当数据量较大时,并行排序会有较大的差异,数据量小的话影响不大,中等的话,并行排序会比sort慢几毫秒。

    public static void parallelSort(int[] a) {
            int n = a.length, p, g;
            if (n <= MIN_ARRAY_SORT_GRAN ||
                (p = ForkJoinPool.getCommonPoolParallelism()) == 1)
                DualPivotQuicksort.sort(a, 0, n - 1, null, 0, 0);
            else
                new ArraysParallelSortHelpers.FJInt.Sorter
                    (null, a, new int[n], 0, n, 0,
                     ((g = n / (p << 2)) <= MIN_ARRAY_SORT_GRAN) ?
                     MIN_ARRAY_SORT_GRAN : g).invoke();
        }
    
        public static void parallelSort(int[] a, int fromIndex, int toIndex) {
            rangeCheck(a.length, fromIndex, toIndex);
            int n = toIndex - fromIndex, p, g;
            if (n <= MIN_ARRAY_SORT_GRAN ||
                (p = ForkJoinPool.getCommonPoolParallelism()) == 1)
                DualPivotQuicksort.sort(a, fromIndex, toIndex - 1, null, 0, 0);
            else
                new ArraysParallelSortHelpers.FJInt.Sorter
                    (null, a, new int[n], fromIndex, n, 0,
                     ((g = n / (p << 2)) <= MIN_ARRAY_SORT_GRAN) ?
                     MIN_ARRAY_SORT_GRAN : g).invoke();
        }
    
    

    ForkJoinPool:支持将一个任务拆分成多个小任务并行计算然后合并。(见ForkJoinPool,挖个坑,看多线程的时候写//TODO)

    不太理解parallelSort(int[] a)里面为什么不调用parallelSort(int[] a, int fromIndex, int toIndex),代码部分重复了呀?//TODO

    如果满足条件则会调用arraysparallelsorthelpers中的每个基本类型对应的类的sort函数)如果满足条件则会调用ArraysParallelSortHelpers中的每个基本类型对应的类的sort函数。

    parallelPrefix

    并行,lambda//TODO

    binarySearch 二分查找
    • 基本类型
     public static int binarySearch(int[] a, int key) {
            return binarySearch0(a, 0, a.length, key);
        }
    
     public static int binarySearch(int[] a, int fromIndex, int toIndex,
                                   int key) {
        rangeCheck(a.length, fromIndex, toIndex);
        return binarySearch0(a, fromIndex, toIndex, key);
    }
    
    

    该方法会返回一个查找的key的index,如果没找到,就会记录这个值可以插入数组的index,返回-(index+1)

            Object[] a = { 1 , 2 ,3, 5 , 6 , 7 };
            System.out.println ( Arrays.binarySearch (a , 3));//2
            System.out.println ( Arrays.binarySearch (a , 4));//-4
    
    

    binarySearch(int[] a, int key)在内部调用了binarySearch(int[] a, int fromIndex, int toIndex,int key),上面parallelSort()为什么不这么做呢?

    • 自定义类型
     public static <T> int binarySearch(T[] a, int fromIndex, int toIndex,T key, Comparator<? super T> c) {
            return binarySearch0(a, 0, a.length, key, c);
        }
    
    

    如果类没有实现Comparable或其他情况,那么查找的时候也要把比较函数传进来

    • equals 和 deepEquals
        public static boolean equals(Object[] a, Object[] a2) {
            if (a==a2)
                return true;
            if (a==null || a2==null)
                return false;
    
            int length = a.length;
            if (a2.length != length)
                return false;
    
            for (int i=0; i<length; i++) {
                Object o1 = a[i];
                Object o2 = a2[i];
                if (!(o1==null ? o2==null : o1.equals(o2)))
                    return false;
            }
    
            return true;
        }
    
    

    各种类型都差不多,先比较地址,再判断null,再长度,最后一个一个元素判断,不过自定义类型还需要再判断一次取出的元素是不是null的! deepEquanls用来比较多维的,因为多维存的是引用,直接用equals比较的是地址,如果是object类型,会调用类型自己的equals方法

    • fill
        public static void fill(Object[] a, Object val) {
            for (int i = 0, len = a.length; i < len; i++)
                a[i] = val;
        }
        public static void fill(Object[] a, int fromIndex, int toIndex, Object val) {
            rangeCheck(a.length, fromIndex, toIndex);
            for (int i = fromIndex; i < toIndex; i++)
                a[i] = val;
        }
    
    

    初始化数组,填充范围内全为指定值

    -copyOf 和 copyOfRange

        public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
            @SuppressWarnings("unchecked")
            T[] copy = ((Object)newType == (Object)Object[].class)
                ? (T[]) new Object[newLength]
                : (T[]) Array.newInstance(newType.getComponentType(), newLength);
            System.arraycopy(original, 0, copy, 0,
                             Math.min(original.length, newLength));
            return copy;
        }
    
    

    先进行类型判断 底层调用的是本地方法System.arraycopy,会对指定的长度进行合法判断,copyOfRange与copyOf类似

    public static native void arraycopy(Object src,  int  srcPos,Object dest, int destPos,int length);
    
    
    • asList
        public static <T> List<T> asList(T... a) {
            return new ArrayList<>(a);
        }
    
    

    返回一个Arrays内部定义的一个ArrayList,若要转化为数组,基本类型就用循环,实例对象则如下

     Integer[] a = { 1 , 2 , 5 , 6 , 7 , 4 , 3 , 0 };
     Integer[] b = new Integer[ a.length ];
     Arrays.asList(a).toArray (b);
    
    
    • hashCode 和 deepHashCode

    基本类型:

    int

     public static int hashCode(int a[]) {
            if (a == null)
                return 0;
    
            int result = 1;
            for (int element : a)
                result = 31 * result + element;
    
            return result;
        }
    
    

    循环叠加结果,result = 31 * result + element;

    double

        public static int hashCode(double a[]) {
            if (a == null)
                return 0;
    
            int result = 1;
            for (double element : a) {
                long bits = Double.doubleToLongBits(element);
                result = 31 * result + (int)(bits ^ (bits >>> 32));
            }
            return result;
        }
    
    

    小数比较的话有精读问题,这里使用Double的doubleToLongBits方法处理的。
    Double.doubleToLongBits(element);将double的元素转换为longbit

    object类型和基本类型差不多,不过多了一个deepHashCode

        public static int deepHashCode(Object a[]) {
            if (a == null)
                return 0;
    
            int result = 1;
    
            for (Object element : a) {
                int elementHash = 0;
                if (element instanceof Object[])
                    elementHash = deepHashCode((Object[]) element);
                else if (element instanceof byte[])
                    elementHash = hashCode((byte[]) element);
                else if (element instanceof short[])
                    elementHash = hashCode((short[]) element);
                else if (element instanceof int[])
                    elementHash = hashCode((int[]) element);
                else if (element instanceof long[])
                    elementHash = hashCode((long[]) element);
                else if (element instanceof char[])
                    elementHash = hashCode((char[]) element);
                else if (element instanceof float[])
                    elementHash = hashCode((float[]) element);
                else if (element instanceof double[])
                    elementHash = hashCode((double[]) element);
                else if (element instanceof boolean[])
                    elementHash = hashCode((boolean[]) element);
                else if (element != null)
                    elementHash = element.hashCode();
    
                result = 31 * result + elementHash;
            }
    
            return result;
        }
    
    

    当数组里存放数组时,若用hashCode(object[]),数组会根据数组地址去计算hashcode,而用deepHashCode则会计算数组中的值

    hashcode 例子:

            int[] m = { 1 };
            int[] n = { 1 };
            Object[] a = { 1 , 2 , 5 , 6 , 7 , 4 , 3 , m };
            Object[] b = { 1 , 2 , 5 , 6 , 7 , 4 , 3 , n };
            System.out.println (Arrays.hashCode (a)==Arrays.hashCode (b));//false
            System.out.println (Arrays.deepHashCode (a)==Arrays.deepHashCode (b));//true
    
    
    • toStirng 和deepToString
      public static String toString(Object[] a) {
            if (a == null)
                return "null";
    
            int iMax = a.length - 1;
            if (iMax == -1)
                return "[]";
    
            StringBuilder b = new StringBuilder();
            b.append('[');
            for (int i = 0; ; i++) {
                b.append(String.valueOf(a[i]));
                if (i == iMax)
                    return b.append(']').toString();
                b.append(", ");
            }
        }
    
    

    deepToStriing,原理和之前deepHashCode差不多,太长了就不贴了,需要的时候可以点进去看看,里面还是有一些细节注意,比如初始化StringBuilder大小,回溯,还用了个set,用...表示重复元素


    剩下一堆java 8的方法,留坑//TODO

    相关文章

      网友评论

        本文标题:Arrays源码阅读

        本文链接:https://www.haomeiwen.com/subject/pvuqlftx.html