美文网首页
Java数据结构

Java数据结构

作者: 尘世的鱼 | 来源:发表于2017-03-31 14:33 被阅读0次

java集合类主要分为两大体系,继承自CollectionListSet,还有自己作为根的Map.大体的结构如下.

Collection
├List
│├LinkedList
│├ArrayList
│└Vector
│ └Stack
└Set
 ├HashSet
 ├TreeSet
Map
├Hashtable
├HashMap
└TreeMap
└WeakHashMap

Map

HashMap通过hash表实现的key-value存储,按照key的hashCode存储,可以有null key,
TreeMap是有序的,通过key的Comparable比较器实现key-value的有序存储
LinkedHashMap也是有序的,也是通过key的hashCode存储,但是遍历是增加了有序属性,即与加入的顺序保持一致

HashMap

HashMap是基于hash算法实现的,通过hash因子的作用,将元素"比较平均"的分散,以提高元素查找的命中率.具体的实现原理如下图:

HashMap是非线程安全的,允许null key,当threshold=capacity*loadfactor时会扩容为capacity<<1,这里capacity为桶的数量.

以下是put<k,v>()方法:

public V put(K key, V value) {
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    if (key == null)
        return putForNullKey(value);
    int hash = hash(key);
    int i = indexFor(hash, table.length);
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }

    modCount++;
    addEntry(hash, key, value, i);
    return null;
}

可以看到优先判断null key,然后计算keyhash值,通过hash值与capacity结合判断位于Hash桶的位置,然后判断是否有当前keyEntry,如果存在,替换value为新值,并返回旧的value,否则添加一个新的Entry,并且返回null,如果一个桶已有至少一个Entry,则会作为链表的第一个元素插入.

HashTable

HashTable的原理与HashMap原理类似,只是比较特殊的所有操作加上了对当前对象操作的synchronized,以达到同步锁的功能,从而实现线程同步.

public synchronized V put(K key, V value) {
    // Make sure the value is not null
    if (value == null) {
        throw new NullPointerException();
    }

    // Makes sure the key is not already in the hashtable.
    Entry tab[] = table;
    int hash = hash(key);
    int index = (hash & 0x7FFFFFFF) % tab.length;
    for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
        if ((e.hash == hash) && e.key.equals(key)) {
            V old = e.value;
            e.value = value;
            return old;
        }
    }

    modCount++;
    if (count >= threshold) {
        // Rehash the table if the threshold is exceeded
        rehash();

        tab = table;
        hash = hash(key);
        index = (hash & 0x7FFFFFFF) % tab.length;
    }

    // Creates the new entry.
    Entry<K,V> e = tab[index];
    tab[index] = new Entry<>(hash, key, value, e);
    count++;
    return null;
}

 private int hash(Object k) {
        // hashSeed will be zero if alternative hashing is disabled.
        return hashSeed ^ k.hashCode();
    }

从上可知,HashTable不允许加入null key,null value.

还有一个就是,HashTable初始容量是11.

Collection

Hashset

Hashset本应不在map系列,但由于Hashset的实现是基于HashMap实现的,所以这里列出,

// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();

/**
 * Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
 * default initial capacity (16) and load factor (0.75).
 */
public HashSet() {
    map = new HashMap<>();
}

public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}

从上可以看出,每次add一个元素,其实是将该元素当做一个key存入Hashmap中,value为一个"dummy value"(一个Object对象).所以其实是通过Hashmap保证了元素的唯一.

LinkedList与Queue

public class LinkedList<E>
    extends AbstractSequentialList<E>
    implements List<E>, Deque<E>, Cloneable, java.io.Serializable

可知LinkedList实现了Deque,而Deque是丰富了父接口Queue
Queue是Collection接口的子类,Collection实现了Iterable,所以是可遍历的。

Map没有实现Iterable,但是通过一系列方法如entrySet()等转换成集合类Set来实现遍历功能.

Arraylist

Arraylist的实现是基于数组的,初始数组大小为10,容量不足时扩展为原来的1.5倍.

Collections

Collections主要是作为集合方法的一些扩展,有大量的static方法,来帮助我们方便的处理集合,在其中主要摘两点做一些研究:

不变的empty集合

Collections含有很多的静态空集合方法,其实我们使用这些特性的地方无非有两处:

  1. 在自己的方法中return nullreturn Collections.emptyList(),这样可以避免上层调用使用时发生NullPointException.
    2.返回一个不可变(引用不可变)的集合实例.
  @SuppressWarnings("unchecked")
   public static final <T> List<T> emptyList() {
       return (List<T>) EMPTY_LIST;
   }

  @SuppressWarnings("unchecked")
   public static final List EMPTY_LIST = new EmptyList<>();

上面是返回emptyList的源码.

不变的empty迭代器

大多数空方法返回的是不变空集合,但是有以下三个方法返回的是空迭代器:<T> Enumeration<T> emptyEnumeration() (classic iteration method), <T> Iterator<T> emptyIterator(), and <T> ListIterator<T> emptyListIterator()
作用也无非上面返回空集合的那些作用.

    @SuppressWarnings("unchecked")
    public static <T> Iterator<T> emptyIterator() {
        return (Iterator<T>) EmptyIterator.EMPTY_ITERATOR;
    }

    private static class EmptyIterator<E> implements Iterator<E> {
        static final EmptyIterator<Object> EMPTY_ITERATOR
            = new EmptyIterator<>();

        public boolean hasNext() { return false; }
        public E next() { throw new NoSuchElementException(); }
        public void remove() { throw new IllegalStateException(); }
    }

综上,我们可以得出结论,这些空方法可以帮助我们让编码更安全,防止空引用的发生。

Extend

ConcurrentModificationException while Iterating over ArrayList

3 ways to find duplicate elements in an array Java

相关文章

网友评论

      本文标题:Java数据结构

      本文链接:https://www.haomeiwen.com/subject/ukcvottx.html