List接口与其实现类
List类似于数组,可以通过索引来访问元素,实现该接口的常用类有ArrayList
、LinkedList
、Vector
、Stack
等。
ArrayList
ArrayList是动态数组,可以根据插入的元素的数量自动扩容,而使用者不需要知道其内部是什么时候进行扩展的,把它当作足够容量的数组来使用即可。
ArrayList访问元素的方法get
是常数时间,因为是直接根据下标索引来访问的,而add
方法的时间复杂度是O(n)
,因为需要移动元素,将新元素插入到合适的位置。
ArrayList是非线程安全的,即它没有同步,不过,可以通过Collections.synchronizedList()
静态方法返回一个同步的实例,如:
List synList = Collections.synchronizedList(list);
数组扩容:ArrayList在插入元素的时候,都会检查当前的数组大小是否足够,如果不够,将会扩容到当前容量 * 1.5 + 1(加1是为了当前容量为1时,也能扩展到2),即把原来的元素全部复制到一个两倍大小的新数组,将旧的数组抛弃掉(等待垃圾回收),这个操作是比较耗时,因此建议在创建ArrayList的时候,根据要插入的元素的数量来初步估计Capacity
,并初始化ArrayList,如:
ArrayList list = new ArrayList(100);
这样,在插入小于100个元素的时候都是不需要进行扩容的,能够带来性能的提升,当然,如果对这个容量估计大了,可能会带来一些空间的损耗。
LinkedList
LinkedList也实现了List接口,其内部实现是使用双向链表来保存元素,因此插入与删除元素的性能都表现不错。它还提供了一些其它操作方法,如在头部、尾部插入或者删除元素,因此,可以用它来实现栈、队列、双向队列。
由于是使用链表保存元素的,所以随机访问元素的时候速度会比较慢(需要遍历链表找到目标元素),这一点相比ArrayList的随机访问要差,ArrayList是采用数组实现方式,直接使用下标可以访问到元素而不需要遍历。因此,在需要频繁随机访问元素的情况下,建议使用ArrayList。
与ArrayList一样,LinkedList也是非同步的,如果需要实现多线程访问,则需要自己在外部实现同步方法。当然也可以使用Collections.synchronizedList()
静态方法。
Vector
Vector是ArrayList的线程同步版本,即是说Vector是同步的,支持多线程访问。除此之外,还有一点不同时,当容量不够时,Vector默认扩展一倍容量,而ArrayList是当前容量 * 1.5 + 1
Stack
Stack是一种后进先出的数据结构,继承自Vector类,提供了push
、pop
、peek
(获得栈顶元素)等方法。
Set接口
Set是不能包含重合元素的容器,其实现类有HashSet,继承于它的接口有SortedSet接口等。Set中提供了加、减、和交等集合操作函数。Set不能按照索引随机访问元素,这是它与List的一个重要区别。
HashSet
HashSet实现了Set接口,其内部是采用HashMap实现的。放入HashSet的对象最好重写hashCode
、equals
方法,因为默认的这两个方法很可能与你的业务逻辑是不一致的,而且,要同时重写这两个函数,如果只重写其中一个,很容易发生意想不到的问题。
记住下面几条规则:
- 相等对象,hashCode一定相等。
- 不等对象,hashCode不一定不相等。
- 两个对象的hashCode相同,不一定相等。
- 两个对象的hashCode不同,一定不相等。
TreeSet
TreeSet同样的Set接口的实现类,同样不能存放相同的对象。它与HashSet不同的是,TreeSet的元素是按照顺序排列的,因此用TreeSet存放的对象需要实现Comparable
接口。
Map接口
Map集合提供了按照“键值对”存储元素的方法,一个键唯一映射一个值。集合中“键值对”整体作为一个实体元素时,类似List集合,但是如果分开来年,Map是一个两列元素的集合:键是一列,值是一列。与Set集合一样,Map也没有提供随机访问的能力,只能通过键来访问对应的值。
Map的每一个元素都是一个Map.Entry
,这个实体的结构是< Key, Value >
样式。
HashMap
HashMap实现了Map接口,但它是非线程安全的。HashMap允许key
值为null
,value
也可以为null
。
Hashtable
Hashtable也是Map的实现类,继承自Dictionary类。它与HashMap不同的是,它是线程安全的。而且它不允许key
为null
,value
也不能为null
。
由于它是线程安全的,在效率上稍差于HashMap。
List总结
ArrayList内部实现采用动态数组,当容量不够时,自动扩容至(当前容量1.5+1)。元素的顺序按照插入的顺序排列。默认初始容量为10。
contains复杂度为O(n),add复杂度为分摊的常数,即添加n个元素需要O(n)时间,remove为O(n),get复杂度为O(1)
随机访问效率高,随机插入、删除效率低。ArrayList是非线程安全*的。
LinkedList内部使用双向链表实现,随机访问效率低,随机插入、删除效率高。可以当作堆栈、队列、双向队列来使用。LinkedList也是非线程安全的。
Vector跟ArrayList是类似的,内部实现也是动态数组,随机访问效率高。Vector是线程安全的。
Stack是栈,继承于Vector,其各种操作也是基于Vector的各种操作,因此其内部实现也是动态数组,先进后出。Stack是线程安全的。
List使用场景
- 对于需要快速插入、删除元素,应该使用LinkedList
- 对于需要快速随机访问元素,应该使用ArrayList
- 如果List需要被多线程操作,应该使用Vector,如果只会被单线程操作,应该使用ArrayList
Set总结
HashSet内部是使用HashMap实现的,HashSet的key值是不允许重复的,如果放入的对象是自定义对象,那么最好能够同时重写hashCode
与equals
函数,这样就能自定义添加的对象在什么样的情况下是一样的,即能保证在业务逻辑下能添加对象到HashSet中,保证业务逻辑的正确性。另外,HashSet里的元素不是按照顺序存储的。HashSet是非线程安全的。
TreeSet存储的元素是按顺序存储的,如果是存储的元素是自定义对象,那么需要实现Comparable接口。TreeSet也是非线程安全的。
LinkedHashSet继承自HashSet,它与HashSet不同的是,LinkedHashSet存储元素的顺序是按照元素的插入顺序存储的。LinkedHashSet也是非线程安全的。
Map总结
HashMap存储键值对。当程序试图将一个key-value
对放入 HashMap 中时,程序首先根据该key
的hashCode()
返回值决定该Entry
的存储位置:如果两个Entry
的key
的hashCode()
返回值相同,那它们的存储位置相同。如果这两个Entry
的key
通过equals
比较返回true
,新添加Entry
的value
将覆盖集合中原有Entry
的 value
,但key
不会覆盖。如果这两个Entry
的key
通过equals
比较返回false
,新添加的Entry
将与集合中原有Entry
形成Entry
链,而且新添加的 Entry 位于 Entry 链的头部。看下面HashMap添加键值对的源代码:
public V put(K key, V value) {
if (key == null)
return putForNullKey(value);
int hash = hash(key.hashCode());
int i = indexFor(hash, table.length);
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i);
return null;
}
void addEntry(int hash, K key, V value, int bucketIndex) {
Entry<K,V> e = table[bucketIndex];
table[bucketIndex] = new Entry<>(hash, key, value, e);
if (size++ >= threshold)
resize(2 * table.length);
}
HashMap允许key
、value
值为null
。HashMap是非线程安全的。
Hashtable是HashMap的线程安全版本。而且,key
、value
都不允许为null
。
哈希值的使用不同: Hashtable直接使用对象的hashCode,如下代码:
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
而HashMap重新计算hash值,如下代码:
int hash = hash(key.hashCode());
int i = indexFor(hash, table.length);
static int hash(int h) {
// This function ensures that hashCodes that differ only by
// constant multiples at each bit position have a bounded
// number of collisions (approximately 8 at default load factor).
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
}
static int indexFor(int h, int length) {
return h & (length-1);
}
扩展容量不同: Hashtable中hash数组默认大小是11,增加的方式是 old*2+1。HashMap中hash数组的默认大小是16,而且一定是2的指数。
网友评论