美文网首页学习资料技术文
Java常用集合类总结

Java常用集合类总结

作者: AlvinL | 来源:发表于2015-03-31 13:20 被阅读1085次

    List接口与其实现类

    List类似于数组,可以通过索引来访问元素,实现该接口的常用类有ArrayListLinkedListVectorStack等。

    ArrayList

    ArrayList是动态数组,可以根据插入的元素的数量自动扩容,而使用者不需要知道其内部是什么时候进行扩展的,把它当作足够容量的数组来使用即可。
    ArrayList访问元素的方法get是常数时间,因为是直接根据下标索引来访问的,而add方法的时间复杂度是O(n),因为需要移动元素,将新元素插入到合适的位置。
    ArrayList是非线程安全的,即它没有同步,不过,可以通过Collections.synchronizedList()静态方法返回一个同步的实例,如:

    List synList = Collections.synchronizedList(list);
    

    数组扩容:ArrayList在插入元素的时候,都会检查当前的数组大小是否足够,如果不够,将会扩容到当前容量 * 1.5 + 1(加1是为了当前容量为1时,也能扩展到2),即把原来的元素全部复制到一个两倍大小的新数组,将旧的数组抛弃掉(等待垃圾回收),这个操作是比较耗时,因此建议在创建ArrayList的时候,根据要插入的元素的数量来初步估计Capacity,并初始化ArrayList,如:

    ArrayList list = new ArrayList(100);
    

    这样,在插入小于100个元素的时候都是不需要进行扩容的,能够带来性能的提升,当然,如果对这个容量估计大了,可能会带来一些空间的损耗。

    LinkedList

    LinkedList也实现了List接口,其内部实现是使用双向链表来保存元素,因此插入与删除元素的性能都表现不错。它还提供了一些其它操作方法,如在头部、尾部插入或者删除元素,因此,可以用它来实现栈、队列、双向队列。
    由于是使用链表保存元素的,所以随机访问元素的时候速度会比较慢(需要遍历链表找到目标元素),这一点相比ArrayList的随机访问要差,ArrayList是采用数组实现方式,直接使用下标可以访问到元素而不需要遍历。因此,在需要频繁随机访问元素的情况下,建议使用ArrayList。
    与ArrayList一样,LinkedList也是非同步的,如果需要实现多线程访问,则需要自己在外部实现同步方法。当然也可以使用Collections.synchronizedList()静态方法。

    Vector

    Vector是ArrayList的线程同步版本,即是说Vector是同步的,支持多线程访问。除此之外,还有一点不同时,当容量不够时,Vector默认扩展一倍容量,而ArrayList是当前容量 * 1.5 + 1

    Stack

    Stack是一种后进先出的数据结构,继承自Vector类,提供了pushpoppeek(获得栈顶元素)等方法。

    Set接口

    Set是不能包含重合元素的容器,其实现类有HashSet,继承于它的接口有SortedSet接口等。Set中提供了加、减、和交等集合操作函数。Set不能按照索引随机访问元素,这是它与List的一个重要区别。

    HashSet

    HashSet实现了Set接口,其内部是采用HashMap实现的。放入HashSet的对象最好重写hashCodeequals方法,因为默认的这两个方法很可能与你的业务逻辑是不一致的,而且,要同时重写这两个函数,如果只重写其中一个,很容易发生意想不到的问题。
    记住下面几条规则:

    • 相等对象,hashCode一定相等。
    • 不等对象,hashCode不一定不相等。
    • 两个对象的hashCode相同,不一定相等。
    • 两个对象的hashCode不同,一定不相等。

    TreeSet

    TreeSet同样的Set接口的实现类,同样不能存放相同的对象。它与HashSet不同的是,TreeSet的元素是按照顺序排列的,因此用TreeSet存放的对象需要实现Comparable接口。

    Map接口

    Map集合提供了按照“键值对”存储元素的方法,一个键唯一映射一个值。集合中“键值对”整体作为一个实体元素时,类似List集合,但是如果分开来年,Map是一个两列元素的集合:键是一列,值是一列。与Set集合一样,Map也没有提供随机访问的能力,只能通过键来访问对应的值。
    Map的每一个元素都是一个Map.Entry,这个实体的结构是< Key, Value >样式。

    HashMap

    HashMap实现了Map接口,但它是非线程安全的。HashMap允许key值为nullvalue也可以为null

    Hashtable

    Hashtable也是Map的实现类,继承自Dictionary类。它与HashMap不同的是,它是线程安全的。而且它不允许keynullvalue也不能为null
    由于它是线程安全的,在效率上稍差于HashMap。

    List总结

    ArrayList内部实现采用动态数组,当容量不够时,自动扩容至(当前容量1.5+1)。元素的顺序按照插入的顺序排列。默认初始容量为10。
    contains复杂度为O(n),add复杂度为分摊的常数,即添加n个元素需要O(n)时间,remove为O(n),get复杂度为O(1)
    随机访问效率高,随机插入、删除效率低。ArrayList是
    非线程安全*的。

    LinkedList内部使用双向链表实现,随机访问效率低,随机插入、删除效率高。可以当作堆栈、队列、双向队列来使用。LinkedList也是非线程安全的。

    Vector跟ArrayList是类似的,内部实现也是动态数组,随机访问效率高。Vector是线程安全的。

    Stack是栈,继承于Vector,其各种操作也是基于Vector的各种操作,因此其内部实现也是动态数组,先进后出。Stack是线程安全的。

    List使用场景

    • 对于需要快速插入、删除元素,应该使用LinkedList
    • 对于需要快速随机访问元素,应该使用ArrayList
    • 如果List需要被多线程操作,应该使用Vector,如果只会被单线程操作,应该使用ArrayList

    Set总结

    HashSet内部是使用HashMap实现的,HashSet的key值是不允许重复的,如果放入的对象是自定义对象,那么最好能够同时重写hashCodeequals函数,这样就能自定义添加的对象在什么样的情况下是一样的,即能保证在业务逻辑下能添加对象到HashSet中,保证业务逻辑的正确性。另外,HashSet里的元素不是按照顺序存储的。HashSet是非线程安全的。

    TreeSet存储的元素是按顺序存储的,如果是存储的元素是自定义对象,那么需要实现Comparable接口。TreeSet也是非线程安全的。

    LinkedHashSet继承自HashSet,它与HashSet不同的是,LinkedHashSet存储元素的顺序是按照元素的插入顺序存储的。LinkedHashSet也是非线程安全的。

    Map总结

    HashMap存储键值对。当程序试图将一个key-value对放入 HashMap 中时,程序首先根据该keyhashCode()返回值决定该Entry的存储位置:如果两个EntrykeyhashCode() 返回值相同,那它们的存储位置相同。如果这两个Entrykey通过equals比较返回true,新添加Entryvalue将覆盖集合中原有Entryvalue,但key不会覆盖。如果这两个Entrykey通过equals 比较返回false,新添加的Entry将与集合中原有Entry形成Entry 链,而且新添加的 Entry 位于 Entry 链的头部。看下面HashMap添加键值对的源代码:

    public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key.hashCode());
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
    
        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }
    
    void addEntry(int hash, K key, V value, int bucketIndex) {
        Entry<K,V> e = table[bucketIndex];
        table[bucketIndex] = new Entry<>(hash, key, value, e);
        if (size++ >= threshold)
            resize(2 * table.length);
    }
    

    HashMap允许keyvalue值为null。HashMap是非线程安全的。

    Hashtable是HashMap的线程安全版本。而且,keyvalue都不允许为null

    哈希值的使用不同: Hashtable直接使用对象的hashCode,如下代码:

    int hash = key.hashCode();
    int index = (hash & 0x7FFFFFFF) % tab.length;
    

    而HashMap重新计算hash值,如下代码:

    int hash = hash(key.hashCode());
    int i = indexFor(hash, table.length);
    
    static int hash(int h) {
        // This function ensures that hashCodes that differ only by
        // constant multiples at each bit position have a bounded
        // number of collisions (approximately 8 at default load factor).
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }
    static int indexFor(int h, int length) {
        return h & (length-1);
    }
    

    扩展容量不同: Hashtable中hash数组默认大小是11,增加的方式是 old*2+1。HashMap中hash数组的默认大小是16,而且一定是2的指数。

    相关文章

      网友评论

      • kange:两个对象的hashCode不同,一定相等??
        AlvinL:@kange 谢谢你的指正~这里是笔误,已修正: 两个对象的hashCode不同,一定不相等

      本文标题:Java常用集合类总结

      本文链接:https://www.haomeiwen.com/subject/mwjnxttx.html