Arrays源码阅读

作者: 丶time | 来源:发表于2018-04-22 09:42 被阅读0次

Arrays源码阅读

提供了排序,并行排序,二分查找,范围填充,相等比较,深度比较等方法,深入理解一下实现方法

私有属性:

MIN_ARRAY_SORT_GRAN
 private static final int MIN_ARRAY_SORT_GRAN = 1 << 13;

当数组长度小于MIN_ARRAY_SORT_GRAN将不会执行并行排序算法,源码注释中说原因是因为长度太小,划分任务也会很小,会导致内存争用,反而不会加速,所以设置一个阈值。


NaturalOrder
static final class NaturalOrder implements Comparator<Object> {
        @SuppressWarnings("unchecked")
        public int compare(Object first, Object second) {
            return ((Comparable<Object>)first).compareTo(second);
        }
        static final NaturalOrder INSTANCE = new NaturalOrder();
    }

一个用于自然排序的静态内部类,实现了Comparator接口,重写了compare方法,在方法中对比较类型进行了Comparable类型强转,调用了Comparable接口的compareTo方法,要求比较的对象实现Comparable接口

LegacyMergeSort
static final class LegacyMergeSort {
    private static final boolean userRequested =
        java.security.AccessController.doPrivileged(
            new sun.security.action.GetBooleanAction(
                "java.util.Arrays.useLegacyMergeSort")).booleanValue();
}

安全检查,若用户自己确定可以比较大小,则userRequested为true。这个类未来会被弃用,若未使用,不推荐使用。不过可以到时候看看安全检查的细节//TODO

INSERTIONSORT_THRESHOLD
  private static final int INSERTIONSORT_THRESHOLD = 7;

若元素数量小于7,则采用插入算法

ArrayList
private static class ArrayList<E> extends AbstractList<E>
        implements RandomAccess, java.io.Serializable

这是调用asList()后得到的就是这个类,一个只读的类,不是util.Arraylist。

方法

sort
  • 基本类型
    public static void sort(int[] a) {
        DualPivotQuicksort.sort(a, 0, a.length - 1, null, 0, 0);
    }

    public static void sort(int[] a, int fromIndex, int toIndex) {
        rangeCheck(a.length, fromIndex, toIndex);
        DualPivotQuicksort.sort(a, fromIndex, toIndex - 1, null, 0, 0);
    }

sort底层调用DualPivotQuicksort,双轴快排,一个优化了排序方法,根据元素数量或是归并分组长度和数量,选择优化过的成对插入排序,双轴快排或归并算法。

sort支持int,short,long,char,byte,float,double,自定义类型数组。

[fromIndex,toIndex)左闭右开

  • 自定义类型
    public static void sort(Object[] a) {
        if (LegacyMergeSort.userRequested)
            legacyMergeSort(a);
        else
            ComparableTimSort.sort(a, 0, a.length, null, 0, 0);
    }
    public static void sort(Object[] a, int fromIndex, int toIndex) {
        rangeCheck(a.length, fromIndex, toIndex);
        if (LegacyMergeSort.userRequested)
            legacyMergeSort(a, fromIndex, toIndex);
        else
            ComparableTimSort.sort(a, fromIndex, toIndex, null, 0, 0);
    } 

安全检查,legacyMergeSort(a):底层调用归并排序,若递归中,若元素小于INSERTIONSORT_THRESHOLD,则直接插入排序

若没有,调用ComparableTimSort.sort,一个优化过的归并排序,考虑了最坏情况,并且与插入排序混合使用。

    public static <T> void sort(T[] a, Comparator<? super T> c) {
    if (c == null) {
        sort(a);
    } else {
        if (LegacyMergeSort.userRequested)
            legacyMergeSort(a, c);
        else
            TimSort.sort(a, 0, a.length, c, null, 0, 0);
    }
}
 public static <T> void sort(T[] a, int fromIndex, int toIndex,
                                Comparator<? super T> c) {
        if (c == null) {
            sort(a, fromIndex, toIndex);
        } else {
            rangeCheck(a.length, fromIndex, toIndex);
            if (LegacyMergeSort.userRequested)
                legacyMergeSort(a, fromIndex, toIndex, c);
            else
                TimSort.sort(a, fromIndex, toIndex, c, null, 0, 0);
        }
    }

和上面类似


parallelSort 并行排序

当数据量较大时,并行排序会有较大的差异,数据量小的话影响不大,中等的话,并行排序会比sort慢几毫秒。

public static void parallelSort(int[] a) {
        int n = a.length, p, g;
        if (n <= MIN_ARRAY_SORT_GRAN ||
            (p = ForkJoinPool.getCommonPoolParallelism()) == 1)
            DualPivotQuicksort.sort(a, 0, n - 1, null, 0, 0);
        else
            new ArraysParallelSortHelpers.FJInt.Sorter
                (null, a, new int[n], 0, n, 0,
                 ((g = n / (p << 2)) <= MIN_ARRAY_SORT_GRAN) ?
                 MIN_ARRAY_SORT_GRAN : g).invoke();
    }

    public static void parallelSort(int[] a, int fromIndex, int toIndex) {
        rangeCheck(a.length, fromIndex, toIndex);
        int n = toIndex - fromIndex, p, g;
        if (n <= MIN_ARRAY_SORT_GRAN ||
            (p = ForkJoinPool.getCommonPoolParallelism()) == 1)
            DualPivotQuicksort.sort(a, fromIndex, toIndex - 1, null, 0, 0);
        else
            new ArraysParallelSortHelpers.FJInt.Sorter
                (null, a, new int[n], fromIndex, n, 0,
                 ((g = n / (p << 2)) <= MIN_ARRAY_SORT_GRAN) ?
                 MIN_ARRAY_SORT_GRAN : g).invoke();
    }

ForkJoinPool:支持将一个任务拆分成多个小任务并行计算然后合并。(见ForkJoinPool,挖个坑,看多线程的时候写//TODO)

不太理解parallelSort(int[] a)里面为什么不调用parallelSort(int[] a, int fromIndex, int toIndex),代码部分重复了呀?//TODO

如果满足条件则会调用arraysparallelsorthelpers中的每个基本类型对应的类的sort函数)如果满足条件则会调用ArraysParallelSortHelpers中的每个基本类型对应的类的sort函数。

parallelPrefix

并行,lambda//TODO

binarySearch 二分查找
  • 基本类型
 public static int binarySearch(int[] a, int key) {
        return binarySearch0(a, 0, a.length, key);
    }

 public static int binarySearch(int[] a, int fromIndex, int toIndex,
                               int key) {
    rangeCheck(a.length, fromIndex, toIndex);
    return binarySearch0(a, fromIndex, toIndex, key);
}

该方法会返回一个查找的key的index,如果没找到,就会记录这个值可以插入数组的index,返回-(index+1)

        Object[] a = { 1 , 2 ,3, 5 , 6 , 7 };
        System.out.println ( Arrays.binarySearch (a , 3));//2
        System.out.println ( Arrays.binarySearch (a , 4));//-4

binarySearch(int[] a, int key)在内部调用了binarySearch(int[] a, int fromIndex, int toIndex,int key),上面parallelSort()为什么不这么做呢?

  • 自定义类型
 public static <T> int binarySearch(T[] a, int fromIndex, int toIndex,T key, Comparator<? super T> c) {
        return binarySearch0(a, 0, a.length, key, c);
    }

如果类没有实现Comparable或其他情况,那么查找的时候也要把比较函数传进来

  • equals 和 deepEquals
    public static boolean equals(Object[] a, Object[] a2) {
        if (a==a2)
            return true;
        if (a==null || a2==null)
            return false;

        int length = a.length;
        if (a2.length != length)
            return false;

        for (int i=0; i<length; i++) {
            Object o1 = a[i];
            Object o2 = a2[i];
            if (!(o1==null ? o2==null : o1.equals(o2)))
                return false;
        }

        return true;
    }

各种类型都差不多,先比较地址,再判断null,再长度,最后一个一个元素判断,不过自定义类型还需要再判断一次取出的元素是不是null的! deepEquanls用来比较多维的,因为多维存的是引用,直接用equals比较的是地址,如果是object类型,会调用类型自己的equals方法

  • fill
    public static void fill(Object[] a, Object val) {
        for (int i = 0, len = a.length; i < len; i++)
            a[i] = val;
    }
    public static void fill(Object[] a, int fromIndex, int toIndex, Object val) {
        rangeCheck(a.length, fromIndex, toIndex);
        for (int i = fromIndex; i < toIndex; i++)
            a[i] = val;
    }

初始化数组,填充范围内全为指定值

-copyOf 和 copyOfRange

    public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
        @SuppressWarnings("unchecked")
        T[] copy = ((Object)newType == (Object)Object[].class)
            ? (T[]) new Object[newLength]
            : (T[]) Array.newInstance(newType.getComponentType(), newLength);
        System.arraycopy(original, 0, copy, 0,
                         Math.min(original.length, newLength));
        return copy;
    }

先进行类型判断 底层调用的是本地方法System.arraycopy,会对指定的长度进行合法判断,copyOfRange与copyOf类似

public static native void arraycopy(Object src,  int  srcPos,Object dest, int destPos,int length);

  • asList
    public static <T> List<T> asList(T... a) {
        return new ArrayList<>(a);
    }

返回一个Arrays内部定义的一个ArrayList,若要转化为数组,基本类型就用循环,实例对象则如下

 Integer[] a = { 1 , 2 , 5 , 6 , 7 , 4 , 3 , 0 };
 Integer[] b = new Integer[ a.length ];
 Arrays.asList(a).toArray (b);

  • hashCode 和 deepHashCode

基本类型:

int

 public static int hashCode(int a[]) {
        if (a == null)
            return 0;

        int result = 1;
        for (int element : a)
            result = 31 * result + element;

        return result;
    }

循环叠加结果,result = 31 * result + element;

double

    public static int hashCode(double a[]) {
        if (a == null)
            return 0;

        int result = 1;
        for (double element : a) {
            long bits = Double.doubleToLongBits(element);
            result = 31 * result + (int)(bits ^ (bits >>> 32));
        }
        return result;
    }

小数比较的话有精读问题,这里使用Double的doubleToLongBits方法处理的。
Double.doubleToLongBits(element);将double的元素转换为longbit

object类型和基本类型差不多,不过多了一个deepHashCode

    public static int deepHashCode(Object a[]) {
        if (a == null)
            return 0;

        int result = 1;

        for (Object element : a) {
            int elementHash = 0;
            if (element instanceof Object[])
                elementHash = deepHashCode((Object[]) element);
            else if (element instanceof byte[])
                elementHash = hashCode((byte[]) element);
            else if (element instanceof short[])
                elementHash = hashCode((short[]) element);
            else if (element instanceof int[])
                elementHash = hashCode((int[]) element);
            else if (element instanceof long[])
                elementHash = hashCode((long[]) element);
            else if (element instanceof char[])
                elementHash = hashCode((char[]) element);
            else if (element instanceof float[])
                elementHash = hashCode((float[]) element);
            else if (element instanceof double[])
                elementHash = hashCode((double[]) element);
            else if (element instanceof boolean[])
                elementHash = hashCode((boolean[]) element);
            else if (element != null)
                elementHash = element.hashCode();

            result = 31 * result + elementHash;
        }

        return result;
    }

当数组里存放数组时,若用hashCode(object[]),数组会根据数组地址去计算hashcode,而用deepHashCode则会计算数组中的值

hashcode 例子:

        int[] m = { 1 };
        int[] n = { 1 };
        Object[] a = { 1 , 2 , 5 , 6 , 7 , 4 , 3 , m };
        Object[] b = { 1 , 2 , 5 , 6 , 7 , 4 , 3 , n };
        System.out.println (Arrays.hashCode (a)==Arrays.hashCode (b));//false
        System.out.println (Arrays.deepHashCode (a)==Arrays.deepHashCode (b));//true

  • toStirng 和deepToString
  public static String toString(Object[] a) {
        if (a == null)
            return "null";

        int iMax = a.length - 1;
        if (iMax == -1)
            return "[]";

        StringBuilder b = new StringBuilder();
        b.append('[');
        for (int i = 0; ; i++) {
            b.append(String.valueOf(a[i]));
            if (i == iMax)
                return b.append(']').toString();
            b.append(", ");
        }
    }

deepToStriing,原理和之前deepHashCode差不多,太长了就不贴了,需要的时候可以点进去看看,里面还是有一些细节注意,比如初始化StringBuilder大小,回溯,还用了个set,用...表示重复元素


剩下一堆java 8的方法,留坑//TODO

相关文章

  • 2021-05-18 JDK中的Array类

    阅读ArrayList源码,看到Arrays.copyOf方法,如下: 进到Arrays.copyOf方法内部: ...

  • Arrays源码阅读

    Arrays源码阅读 提供了排序,并行排序,二分查找,范围填充,相等比较,深度比较等方法,深入理解一下实现方法 私...

  • Java数组排序原理

    Arrays排序原理 计数排序源码 (short为例) 插入排序源码 (int为例) 快排源码 (int为例) 归...

  • System.arraycopy

    在StringBuffer、StringBuilder、ArrayList,Arrays等类的源码中有很多Syst...

  • 读 Java TimSort算法 源码 笔记

    本来准备看Java容器源码的。但是看到一开始发现Arrays这个类我不是很熟,就顺便把Arrays这个类给看了。A...

  • ArrayList源码分析

    ArrayList源码分析 System.arraycopy()和Arrays.copyOf()方法 两者联系与区...

  • 集合源码基础之数组扩容技术

    集合源码基础之数组扩容技术 数组复制1:Arrays.copyOf(Object[] objects, int l...

  • 【Java 开发常见的坑】—— Arrays 使用

    日常开发中,Arrays工具类十分常用,但如果对Arrays的源码不熟悉的话,就有可能踩到坑。以下是我日常开发或身...

  • JavaScript: sparse arrays vs. de

    前言:最近研究lodash.js源码,提到了sparse arrays 与 denese array。因为不了解这...

  • System.arraycopy

    在看ArrayList源码是看到了Arrays.copyOf底层调用的是系统方法System.arraycopy,...

网友评论

    本文标题:Arrays源码阅读

    本文链接:https://www.haomeiwen.com/subject/pvuqlftx.html