Java集合框架由Java类库的一系列接口、抽象类以及具体实现类组成。集合就是把一组对象组织到一起,然后再根据不同的需求操纵这些数据。集合类型就是容纳这些对象的一个容器。根据集合中是否允许有重复的对象、对象组织在一起是否按某种顺序等标准来划分的话,集合类型又可以细分为许多种不同的子类型。
java集合框架提供了一组基本机制以及这些机制的参考实现,其中基本的集合接口是Collection接口,其他相关的接口还有Iterator接口、RandomAccess接口。
抽象类的好处:提供了接口的部分实现,这样就可以在实现类的基础上实现部分功能而不必重写接口的所有方法。
Collection接口
Collection接口是集合层级结构的根接口,里面的方法有:
int size();
boolean isEmpty();
boolean contains(Object o);
Iterator<E> iterator();
Object[] toArray();
<T> T[] toArray(T[] a);
boolean add(E e);
boolean remove(Object o);
boolean containsAll(Collection<?> c);
boolean addAll(Collection<? extends E> c);
boolean removeAll(Collection<?> c);
boolean retainAll(Collection<?> c); //仅保留给定集合c中的元素(optional operation).
void clear();//清空集合
boolean equals(Object o);//继承自Object
int hashCode();//继承自Object
值得注意的是两个toArray方法:
它们的功能都是都是返回这个集合的对象数组。第二个方法接收一个arrayToFill参数,当这个参数数组足够大时,就把集合中的元素都填入这个数组(多余空间填null);当arrayToFill不够大时,就会创建一个大小与集合相同,类型与arrayToFill相同的数组,并填入集合元素。
我们看一下Collection<E>接口的迭代器:
public interface Iterable<T> {
Iterator<T> iterator();
}
这个接口只定义了一个方法,这个方法要求我们返回一个实现了Iterator<T>类型的对象,所以我们看下Iterator<T>的定义:
public interface Iterator<E> {
boolean hasNext();
E next();
void remove();
}
迭代器就是一个我们用来遍历集合中的对象的东西。即对于集合,我们不像对原始类型数组那样通过数组索引来直接访问相应位置的元素,而是通过迭代器来遍历。这么做的好处是将对于集合类型的遍历行为与被遍历的集合对象分离,这样一来我们无需关心该集合类型的具体实现是怎样的。只要获取这个集合对象的迭代器, 便可以遍历这个集合中的对象了。而像遍历对象的顺序这些细节,全部由它的迭代器来处理。
小总结:Collection接口实现了Iterable<E>接口,这意味着所有实现了Collection接口的具体集合类都是可迭代的。一个迭代器对象也就是实现了Iterator<E>接口的对象,这个接口要求我们实现hasNext()、next()、remove()这三个方法。通常,迭代一个集合对象的代码是这个样子的:
Collection<String> c = ...;
Iterator<String> iter = c.iterator();
while (iter.hasNext()) {
String element = iter.next();
//do something with element
}
以上代码可以用增强for来代替:
for (String element : c) {
//do something with element
}
注意:Iterator接口的remove方法必须在next方法返回一个元素后才能调用!
Collection接口是集合层级结构的根接口。一个集合代表了一组对象,这组对象被称为集合的元素。一些集合允许重复的元素而其他不允许;一些是有序的而一些是无序的。Java类库中并未提供任何对这个接口的直接实现,而是提供了对于它的更具体的子接口的实现(比如Set接口和List接口)。
Collection接口的直接子接口主要有三个:List接口、Set接口和Queue接口。
- List接口:
List是一个有序的集合类型(也被称作序列)。使用List接口可以精确控制每个元素被插入的位置,并且可以通过元素在列表中的索引来访问它。列表允许重复的元素,并且在允许null元素的情况下也允许多个null元素。
官方定义了以下这些方法:
ListIterator<E> listIterator();
void add(int i, E element);
E remove(int i);
E get(int i);
E set(int i, E element);
int indexOf(Object element);
上面有一个listIterator方法,它返回一个列表迭代器。ListIterator<E>接口定义的方法有:
void add(E e) //在当前位置添加一个元素
boolean hasNext() //返回ture如果还有下个元素(在正向遍历列表时使用)
boolean hasPrevious() //反向遍历列表时使用
E next() //返回下一个元素并将cursor(也就是指针)前移一个位置
int nextIndex() //返回下一次调用next方法将返回的元素的索引
E previous() //返回前一个元素并将cursor向前移动一个位置
int previousIndex() //返回下一次调用previous方法将返回的元素的索引void remove() //从列表中移除最近一次调用next方法或previous方法返回的元素
void set(E e) //用e替换最近依次调用next或previous方法返回的元素
ListIterator<E>是Iterator<E>的子接口,它支持像双向迭代这样更加特殊化的操作。
Java类库中常见的实现了List<E>接口的类有:ArrayList, LinkedList,Stack,Vector,AbstractList,AbstractSequentialList等等。
- ArrayList
ArrayList是一个可动态调整大小的数组,允许null类型的元素。Java中的数组大小在初始化时就必须确定下来,而且一旦确定就不能改变,这会使得在很多场景下不够灵活。ArrayList很好地帮我们解决了这个问题,当我们需要一个能根据包含元素的多少来动态调整大小的数组时,那么ArrayList正是我们所需要的。常用方法有:
boolean add(E e) //添加一个元素到数组末尾
void add(int index, E element) //添加一个元素到指定位置
void clear()
boolean contains(Object o)
void ensureCapacity(int minCapacity) //确保ArrayList至少能容纳参数指定数目的对象,若有需要会增加ArrayList实例的容量。
E get(int index) //返回指定位置的元素
int indexOf(Object o)
boolean isEmpty()
Iterator<E> iterator()
ListIterator<E> listIterator()
E remove(int index)
boolean remove(Object o)
E set(int index, E element)
int size()
当我们插入了比较多的元素,导致ArrayList快要装满时,它会自动增长容量。ArrayList内部使用一个Object数组来存储元素,自动增长容量是通过创建一个新的容量更大的Object数组,并将元素从原Object数组复制到新Object数组来实现的。若要想避免这种开销,在知道大概会容纳多少数据时,我们可以在构造时指定好它的大小以尽量避免它自动增长的发生;我们也可以调用ensureCapacity方法来增加ArrayList对象的容量到我们指定的大小。ArrayList有以下三个构造器:
ArrayList()
ArrayList(Collection<? extends E> c)
ArrayList(int initialCapacity) //指定初始capacity,即内部Object数组的初始大小
这里提一下Arraylist的值得注意的一点,集合成员允许出现null元素,而且可以多个。请看一下代码:
/**
* 关于List中是否可以添加Null的测试
* @author kyy
*/
public class Demo1 {
public static void main(String[] args) {
List<User> users=new ArrayList<User>();
for (int i = 0; i < 10; i++) {
users.add(new User());
}
//添加null不报错,但是这样在堆集合元素进行方法调用时,有可能出现空指针异常
users.add(null);
//添加Object,报错
//users.add(new Object());
System.out.println(users.size());//运行结果:11
for (User user : users) {
//这里要进行判断,不然有可能发生空指针异常
/*if(user!=null){
System.out.println(user.getUsername());
}*/
System.out.println(user.getUsername());
}
}
}
class User{
private String username="小明";
private int age;
public String getUsername(){
return this.username;
}
}
因为Arraylist中允许出现null元素,所以在遍历的时候,如果为对象,获取对象属性的时候要先判断遍历出来的对象是否为null,这样才可以避免空指针异常。
而且,集合不为空不代表集合长度就不为0,所以在遍历集合的时候要进行双重判断,先判断集合是否为Null,再判断集合是否长度大于0.
- LinkedList类
LinkedList类代表了一个双向链表,也允许null元素。这个类同ArrayList一样,不是线程安全的。
这个类中主要有以下的方法:
void addFirst(E element);
void addLast(E element);
E getFirst();
E getLast();
E removeFirst();
E removeLast();
LinkedList的一个缺陷在于它不支持对元素的高效随机访问,要想随机访问其中的元素,需要逐个扫描直到遇到符合条件的元素。只有当我们需要减少在列表中间添加或删除元素操作的代价时,可以考虑使用LinkedList。jdk类库中实现了List<E>接口的类有:ArrayList, LinkedList,Stack,Vector,AbstractList,AbstractSequentialList等等。
说到线程安全,List接口的几个实现类中,Arraylist和Linkedlist都不是线程安全的,而Stack和Vector则是线程安全的,但是线程不安全的可以通过Collections的同步方法转换为线程安全对象,具体实现,请读者翻看jdk源代码,我相信会有另一翻收获的!
参考资料
- 《Java核心技术(卷一)》
- What is a view of a collection?
- Java SE 7 Docs
网友评论