参考地址:
《Java 泛型,你了解类型擦除吗?》
《Java中的逆变与协变》
《java 泛型中 T、E ... 和 问号(通配符)的区别》
注:本文是在 frank909 的文章 《Java 泛型,你了解类型擦除吗?》 的基础上,参考其他文章并重新总结排版而来的。
一. 泛型
泛型的英文是 generics,generic 的意思是通用,而翻译成中文,“泛”应该意为广泛,型是类型。所以泛型就是能广泛适用的类型。
1.1 泛型的定义
泛型还有一种较为准确的说法就是为了参数化类型,或者说可以将类型当作参数传递给一个类或者是方法。
那么,如何解释类型参数化呢?
public class Cache {
Object value;
public Object getValue() {
return value;
}
public void setValue(Object value) {
this.value = value;
}
}
假设 Cache 能够存取任何类型的值,于是,我们可以这样使用它。
Cache cache = new Cache();
cache.setValue(134);
int value = (int) cache.getValue();
cache.setValue("hello");
String value1 = (String) cache.getValue();
使用的方法也很简单,只要我们做正确的强制转换就好了。
但是,泛型却给我们带来了不一样的编程体验。
public class Cache<T> {
T value;
public Object getValue() {
return value;
}
public void setValue(T value) {
this.value = value;
}
}
这就是泛型,它将 value 这个属性的类型也参数化了,这就是所谓的参数化类型。再看它的使用方法。
Cache<String> cache1 = new Cache<String>();
cache1.setValue("123");
String value2 = cache1.getValue();
Cache<Integer> cache2 = new Cache<Integer>();
cache2.setValue(456);
int value3 = cache2.getValue();
最显而易见的好处就是它不再需要对取出来的结果进行强制转换了。但,还有另外一点不同。
泛型不再需要对取出来的结果进行强制转换泛型除了可以将类型参数化外,而参数一旦确定好,如果类似不匹配,编译器就不通过。
上面代码显示,无法将一个 String 对象设置到 cache2 中,因为泛型让它只接受 Integer 的类型。
所以,综合上面信息,我们可以得到下面的结论。
- 与普通的 Object 代替一切类型这样简单粗暴而言,泛型使得数据的类别可以像参数一样由外部传递进来。它提供了一种扩展能力。它更符合面向抽象开发的软件编程宗旨。
- 当具体的类型确定后,泛型又提供了一种类型检测的机制,只有相匹配的数据才能正常的赋值,否则编译器就不通过。所以说,它是一种类型安全检测机制,一定程度上提高了软件的安全性防止出现低级的失误。
- 泛型提高了程序代码的可读性,不必要等到运行的时候才去强制转换,在定义或者实例化阶段,因为 Cache< String > 这个类型显化的效果,程序员能够一目了然猜测出代码要操作的数据类型。
下面的文章,我们正常介绍泛型的相关知识。
1.2 泛型的使用
泛型按照使用情况可以分为 3 种:
- 泛型类。
- 泛型方法。
- 泛型接口。
1.2.1 泛型类
我们可以这样定义一个泛型类。
public class Test<T> {
T field1;
}
尖括号 < > 中的 T 被称作是类型参数,用于指代任何类型。事实上,T 只是一种习惯性写法,如果你愿意。你可以这样写。
public class Test<Hello> {
Hello field1;
}
但出于规范的目的,Java 还是建议我们用单个大写字母来代表类型参数。常见的如:
- T 代表一般的任何类。
- E 代表 Element 的意思,或者 Exception 异常的意思。
- K 代表 Key 的意思。
- V 代表 Value 的意思,通常与 K 一起配合使用。
- S 代表 Subtype 的意思,文章后面部分会讲解示意。
如果一个类被 <T> 的形式定义,那么它就被称为是泛型类。
那么对于泛型类怎么样使用呢?
Test<String> test1 = new Test<>();
Test<Integer> test2 = new Test<>();
只要在对泛型类创建实例的时候,在尖括号中赋值相应的类型便是。T 就会被替换成对应的类型,如 String 或者是 Integer。你可以相像一下,当一个泛型类被创建时,内部自动扩展成下面的代码。
public class Test<String> {
String field1;
}
当然,泛型类不至接受一个类型参数,它还可以这样接受多个类型参数。
public class MultiType <E,T>{
E value1;
T value2;
public E getValue1(){
return value1;
}
public T getValue2(){
return value2;
}
}
1.2.2 泛型方法
public class Test1 {
public <T> void testMethod(T t){
}
}
泛型方法与泛型类稍有不同的地方是,类型参数也就是尖括号那一部分是写在返回值前面的。<T> 中的 T 被称为类型参数,而方法中的 T 被称为参数化类型,它不是运行时真正的参数。
当然,声明的类型参数,其实也是可以当作返回值的类型的。
public <T> T testMethod1(T t){
return null;
}
1.2.3 泛型类与泛型方法共存
public class Test1<T>{
public void testMethod(T t){
System.out.println(t.getClass().getName());
}
public <T> T testMethod1(T t){
return t;
}
}
上面代码中,Test1< T > 是泛型类,testMethod 是泛型类中的普通方法,而 testMethod1 是一个泛型方法。而泛型类中的类型参数与泛型方法中的类型参数是没有相应的联系的,泛型方法始终以自己定义的类型参数为准。
所以,针对上面的代码,我们可以这样编写测试代码。
Test1<String> t = new Test1();
t.testMethod("generic");
Integer i = t.testMethod1(new Integer(1));
泛型类的实际类型参数是 String,而传递给泛型方法的类型参数是 Integer,两者不想干。
但是,为了避免混淆,如果在一个泛型类中存在泛型方法,那么两者的类型参数最好不要同名。比如,Test1< T > 代码可以更改为这样:
public class Test1<T>{
public void testMethod(T t){
System.out.println(t.getClass().getName());
}
public <E> E testMethod1(E e){
return e;
}
}
1.2.4 泛型接口
泛型接口和泛型类差不多,所以一笔带过。
public interface Iterable<T> {
}
1.3 泛型的类型擦除
泛型是 Java 1.5 版本才引进的概念,在这之前是没有泛型的概念的,但显然,泛型代码能够很好地和之前版本的代码很好地兼容。
这是因为,泛型信息只存在于代码编译阶段,在进入 JVM 之前,与泛型相关的信息会被擦除掉,专业术语叫做类型擦除。
通俗地讲,泛型类和普通类在 java 虚拟机内是没有什么特别的地方。回顾文章开始时的那段代码
List<String> l1 = new ArrayList<String>();
List<Integer> l2 = new ArrayList<Integer>();
System.out.println(l1.getClass() == l2.getClass());
打印的结果为 true 是因为 List< String > 和 List< Integer > 在 jvm 中的 Class 都是 List.class。
泛型信息被擦除了。
可能同学会问,那么类型 String 和 Integer 怎么办?
答案是泛型转译。
public class Erasure <T>{
T object;
public Erasure(T object) {
this.object = object;
}
}
Erasure 是一个泛型类,我们查看它在运行时的状态信息可以通过反射。
Erasure<String> erasure = new Erasure<String>("hello");
Class eclz = erasure.getClass();
System.out.println("erasure class is:"+eclz.getName());
打印的结果是
erasure class is:com.frank.test.Erasure
Class 的类型仍然是 Erasure 并不是 Erasure<T> 这种形式,那我们再看看泛型类中 T 的类型在 jvm 中是什么具体类型。
Field[] fs = eclz.getDeclaredFields();
for ( Field f:fs) {
System.out.println("Field name "+f.getName()+" type:"+f.getType().getName());
}
打印结果是
Field name object type:java.lang.Object
那我们可不可以说,泛型类被类型擦除后,相应的类型就被替换成 Object 类型呢?
这种说法,不完全正确。
我们更改一下代码。
public class Erasure <T extends String>{
// public class Erasure <T>{
T object;
public Erasure(T object) {
this.object = object;
}
}
现在再看测试结果:
Field name object type:java.lang.String
我们现在可以下结论了,在泛型类被类型擦除的时候,之前泛型类中的类型参数部分如果没有指定上限,如 < T > 则会被转译成普通的 Object 类型,如果指定了上限如 < T extends String> 则类型参数就被替换成类型上限。
所以,在反射中。
public class Erasure <T>{
T object;
public Erasure(T object) {
this.object = object;
}
public void add(T object){
}
}
add() 这个方法对应的 Method 的签名应该是 Object.class。
Erasure<String> erasure = new Erasure<String>("hello");
Class eclz = erasure.getClass();
System.out.println("erasure class is:"+eclz.getName());
Method[] methods = eclz.getDeclaredMethods();
for ( Method m:methods ){
System.out.println(" method:"+m.toString());
}
打印结果是
method:public void com.frank.test.Erasure.add(java.lang.Object)
也就是说,如果你要在反射中找到 add 对应的 Method,你应该调用 getDeclaredMethod("add",Object.class) 否则程序会报错,提示没有这么一个方法,原因就是类型擦除的时候,T 被替换成 Object 类型了。
1.4 泛型类型擦除的局限性
类型擦除,是泛型能够与之前的 java 版本代码兼容共存的原因。但也因为类型擦除,它会抹掉很多继承相关的特性,这是它带来的局限性。
理解类型擦除有利于我们绕过开发当中可能遇到的雷区,同样理解类型擦除也能让我们绕过泛型本身的一些限制。比如:
类型擦除带来的局限性正常情况下,因为泛型的限制,编译器不让最后一行代码编译通过,因为类似不匹配,但是,基于对类型擦除的了解,利用反射,我们可以绕过这个限制。
public interface List<E> extends Collection<E>{
boolean add(E e);
}
上面是 List 和其中的 add() 方法的源码定义。
因为 E 代表任意的类型,所以类型擦除时,add 方法其实等同于
boolean add(Object obj);
那么,利用反射,我们绕过编译器去调用 add 方法。
public class ToolTest {
public static void main(String[] args) {
List<Integer> ls = new ArrayList<>();
ls.add(23);
// ls.add("text");
try {
Method method = ls.getClass().getDeclaredMethod("add",Object.class);
method.invoke(ls,"test");
method.invoke(ls,42.9f);
} catch (NoSuchMethodException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (SecurityException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IllegalAccessException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IllegalArgumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (InvocationTargetException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
for ( Object o: ls){
System.out.println(o);
}
}
}
打印结果是:
23
test
42.9
可以看到,利用类型擦除的原理,用反射的手段就绕过了正常开发中编译器不允许的操作限制。
1.5 泛型需注意问题
1.5.1 泛型不接受 8 种基本数据类型
泛型类或者泛型方法中,不接受 8 种基本数据类型。所以,你没有办法进行这样的编码:
List<int> li = new ArrayList<>();
List<boolean> li = new ArrayList<>();
需要使用它们对应的包装类。
List<Integer> li = new ArrayList<>();
List<Boolean> li1 = new ArrayList<>();
对泛型方法的困惑
public <T> T test(T t){
return null;
}
有的同学可能对于连续的两个 T 感到困惑,其实 < T > 是为了说明类型参数,是声明,而后面的不带尖括号的 T 是方法的返回值类型。
你可以相像一下,如果 test() 这样被调用
test("123");
那么实际上相当于
public String test(String t);
1.5.2 Java 不能创建具体类型的泛型数组
这句话可能难以理解,代码说明。
List<Integer>[] li2 = new ArrayList<Integer>[];
List<Boolean> li3 = new ArrayList<Boolean>[];
这两行代码是无法在编译器中编译通过的。原因还是类型擦除带来的影响。
List< Integer> 和 List< Boolean> 在 jvm 中等同于List< Object> ,所有的类型信息都被擦除,程序也无法分辨一个数组中的元素类型具体是 List< Integer>类型还是 List< Boolean> 类型。
但是,
List<?>[] li3 = new ArrayList<?>[10];
li3[1] = new ArrayList<String>();
List<?> v = li3[1];
借助于无限定通配符却可以,前面讲过 ? 代表未知类型,所以它涉及的操作都基本上与类型无关,因此 jvm 不需要针对它对类型作判断,因此它能编译通过,但是,只提供了数组中的元素因为通配符原因,它只能读,不能写。比如,上面的 v 这个局部变量,它只能进行 get() 操作,不能进行 add() 操作,这个在前面通配符的内容小节中已经讲过。
二. 通配符 "?"
除了用 < T > 表示泛型外,还有 < ? > 这种形式。? 被称为通配符。
2.1 通配符 "?" 简介
可能有同学会想,已经有了 < T > 的形式了,为什么还要引进 < ? > 这样的概念呢?
class Base{}
class Sub extends Base{}
Sub sub = new Sub();
Base base = sub;
上面代码显示,Base 是 Sub 的父类,它们之间是继承关系,所以 Sub 的实例可以给一个 Base 引用赋值,那么
List<Sub> lsub = new ArrayList<>();
List<Base> lbase = lsub;
最后一行代码成立吗?编译会通过吗?
答案是否定的。
编译器不会让它通过的。Sub 是 Base 的子类,不代表 List<Sub> 和 List<Base> 有继承关系。
但是,在现实编码中,确实有这样的需求,希望泛型能够处理某一范围内的数据类型,比如某个类和它的子类,对此 Java 引入了通配符这个概念。
所以,通配符的出现是为了指定泛型中的类型范围。
2.2 通配符的协变与逆变
通配符有 3 种形式。
- < ?> 被称作无限定的通配符。
- < ? extends T> 被称作有上限的通配符。
- < ? super T> 被称作有下限的通配符。
2.2.1 无限定通配符
public void testWildCards(Collection<?> collection){
}
上面的代码中,方法内的参数是被无限定通配符修饰的 Collection 对象,它隐略地表达了一个意图或者可以说是限定,那就是 testWidlCards() 这个方法内部无需关注 Collection 中的真实类型,因为它是未知的。所以,你只能调用 Collection 中与类型无关的方法。
调用 Collection 中与类型无关的方法我们可以看到,当 < ? > 存在时,Collection 对象丧失了 add() 方法的功能,编译器不通过。
我们再看代码。
List<?> wildlist = new ArrayList<String>();
wildlist.add(123);// 编译不通过
有人说,< ? > 提供了只读的功能,也就是它删减了增加具体类型元素的能力,只保留与具体类型无关的功能。它不管装载在这个容器内的元素是什么类型,它只关心元素的数量、容器是否为空?我想这种需求还是很常见的吧。
有同学可能会想,< ? > 既然作用这么渺小,那么为什么还要引用它呢? �
个人认为,提高了代码的可读性,程序员看到这段代码时,就能够迅速对此建立极简洁的印象,能够快速推断源码作者的意图。
2.2.2 协变 < ? extends T>
Java 中 String 类型是继承自 Object 的,姑且记做 String ≦ Object,表示 String 是 Object 的子类型,String 的对象可以赋给 Object 的对象。而 Object 的数组类型 Object[],理解成是由 Object 构造出来的一种新的类型,可以认为是一种构造类型,记f(Object),那么可以这么来描述协变和逆变:
- 当 A ≦ B 时,如果有 f(A) ≦ f(B),那么 f 叫做协变;
- 当 A ≦ B 时,如果有 f(B) ≦ f(A),那么 f 叫做逆变;
- 如果上面两种关系都不成立,则叫做不可变。
< ? extends> 实现了泛型的协变,比如:
List<? extends Number> list = new ArrayList<>();
“? extends Number” 则表示通配符 "?" 的上界为 Number,换句话说,就是“? extends Number”可以代表 Number 或其子类,但代表不了 Number 的父类(如Object),因为通配符的上界是 Number。
于是有 "? extends Number" ≦ Number,则 List< ? extends Number> ≦ List< Number >。那么就有:
List<? extends Number> list001 = new ArrayList<Integer>();
List<? extends Number> list002 = new ArrayList<Float>();
但是这里不能向 list001, list002 添加除 null 以外的任意对象。可以这样理解一下,List< Integer > 可以添加 Interger 及其子类,List< Float >可以添加 Float 及其子类,List< Integer >, List< Float > 都是 List< ? extends Number >的子类型,如果能将 Float 的子类添加到 List< ? extends Number >中,就说明 Float 的子类也是可以添加到 List< Integer >中的,显然是不可行。故 Java 为了保护其类型一致,禁止向 List< ? extends Number >添加任意对象,不过却可以添加 null。
2.2.3 逆变 < ? super >
< ? super > 实现了泛型的逆变,比如:
List<? super Number> list = new ArrayList<>();
"? super Number" 则表示通配符 "?" 的下界为 Number。为了保护类型的一致性,因为 "? super Number" 可以是 Object 或其他 Number 的父类,因无法确定其类型,也就不能往List< ? super Number >添加 Number 的任意父类对象。但是可以向 List< ? super Number >添加 Number 及其子类。
List<? super Number> list001 = new ArrayList<Number>();
List<? super Number> list002 = new ArrayList<Object>();
list001.add(new Integer(3));
list002.add(new Integer(3));
三. 通配符与泛型的区别
笔者参考了 《Java 泛型,你了解类型擦除吗?》 与 《java 泛型中 T、E ... 和 问号(通配符)的区别》 两篇文章中对于通配符与泛型的区别,两篇文章中笔者认为后者的描述比较浅显易懂,前者的行文并没有怎么理解。所以笔者比较推荐后者叙述的通配符与泛型的区别。
首先,泛型中 T, E 等符号是泛型类、泛型方法定义时候用的。泛型类的定义紧跟在类名后面;泛型方法的定义紧跟修饰符后面(public)。
- 泛型类:public class TestClassDefine<T>{}
- 泛型方法:public <T> T testGenericMethodDefine(T t){}
通配符 "?",通常是在变量赋值或变量声明时用的。
List<?> unknownList;
List<? extends Number> unknownNumberList;
List<? super Integer> unknownBaseLineIntgerList;
网友评论