java 5.0发布了,许多人都将开始使用这个jdk版本的一些新增特性。从增强的for循环到诸如泛型(generic)之类更复杂的特性,都将很快出现在您所编写的代码中。我们刚刚完成了一个基于java 5.0的大型任务,而本文就是要介绍我们使用这些新特性的体验。本文不是一篇入门性的文章,而是对这些特性以及它们所产生的影响的深入介绍,同时还给出了一些在项目中更有效地使用这些特性的技巧。
简介
在jdk 1.5的beta阶段,我们为bea的java ide开发了一个java 5编译器。因为我们实现了许多新特性,所以人们开始以新的方式利用它们;有些用法很聪明,而有些用法明显应该被列入禁用清单。编译器本身使用了新的语言特性,所以我们也获得了使用这些特性维护代码的直接体验。本文将介绍其中的许多特性和使用它们的体验。
我们假定您已经熟悉了这些新特性,所以不再全面介绍每个特性,而是谈论一些有趣的、但很可能不太明显的内容和用法。这些技巧出自我们的实际体验,并大致按照语言特性进行了分类。
我们将从最简单的特性开始,逐步过渡到高级特性。泛型所包含的内容特别丰富,因此占了本文一半的篇幅。
增强的for循环
为了迭代集合和数组,增强的for循环提供了一个简单、兼容的语法。有两点值得一提:
init表达式
在循环中,初始化表达式只计算一次。这意味着您通常可以移除一个变量声明。在这个例子中,我们必须创建一个整型数组来保存computenumbers()的结果,以防止每一次循环都重新计算该方法。您可以看到,下面的代码要比上面的代码整洁一些,并且没有泄露变量numbers:
未增强的for: int sum = 0; integer[] numbers = computenumbers(); for (int i=0; i < numbers.length ; i++) sum += numbers[i]; 增强后的for: int sum = 0; for ( int number: computenumbers() ) sum += number;
局限性
有时需要在迭代期间访问迭代器或下标,看起来增强的for循环应该允许该操作,但事实上不是这样,请看下面的例子:
for (int i=0; i < numbers.length ; i++) { if (i != 0) system.out.print(","); system.out.print(numbers[i]); }
我们希望将数组中的值打印为一个用逗号分隔的清单。我们需要知道目前是否是第一项,以便确定是否应该打印逗号。使用增强的for循环是无法获知这种信息的。我们需要自己保留一个下标或一个布尔值来指示是否经过了第一项。 这是另一个例子:
for (iterator<integer> it = n.iterator() ; it.hasnext() ; ) if (it.next() < 0) it.remove();
在此例中,我们想从整数集合中删除负数项。为此,需要对迭代器调用一个方法,但是当使用增强的for 循环时,迭代器对我们来说是看不到的。因此,我们只能使用java 5之前版本的迭代方法。 顺便说一下,这里需要注意的是,由于iterator是泛型,所以其声明是iterator<integer>。许多人都忘记了这一点而使用了iterator的原始格式。
注释
注释处理是一个很大的话题。因为本文只关注核心的语言特性,所以我们不打算涵盖它所有的可能形式和陷阱。 我们将讨论内置的注释(suppresswarnings,deprecated和override)以及一般注释处理的局限性。
suppress warnings
该注释关闭了类或方法级别的编译器警告。有时候您比编译器更清楚地知道,代码必须使用一个被否决的方法或执行一些无法静态确定是否类型安全的动作,而使用:
@suppresswarnings("deprecation") public static void selfdestruct() { thread.currentthread().stop(); }
这可能是内置注释最有用的地方。遗憾的是,1.5.0_04的javac不支持它。但是1.6支持它,并且sun正在努力将其向后移植到1.5中。
eclipse 3.1中支持该注释,其他ide也可能支持它。这允许您把代码彻底地从警告中解脱出来。如果在编译时出现警告,可以确定是您刚刚把它添加进来――以帮助查看那些可能不安全的代码。随着泛型的添加,它使用起来将更趁手。
deprecated
遗憾的是,deprecated没那么有用。它本来旨在替换@deprecated javadoc标签,但是由于它不包含任何字段,所以也就没有方法来建议deprecated类或方法的用户应该使用什么做为替代品。大多数用法都同时需要javadoc标签和这个注释。
override
override表示,它所注释的方法应该重写超类中具有相同签名的方法:
@override public int hashcode() { ... }
看上面的例子,如果没有在hashcode中将“c”大写,在编译时不会出现错误,但是在运行时将无法像期望的那样调用该方法。通过添加override标签,编译器会提示它是否真正地执行了重写。
在超类发生改变的情况中,这也很有帮助。如果向该方法中添加一个新参数,而且方法本身也被重命名了,那么子类将突然不能编译,因为它不再重写超类的任何东西。
其它注释
注释在其他场景中非常有用。当不是直接修改行为而是增强行为时,特别是在添加样板代码的情况下,注释在诸如ejb和web services这样的框架中运行得非常好。
注释不能用做预处理器。sun的设计特别预防了完全因为注释而修改类的字节码。这样可以正确地理解该语言的成果,而且ide之类的工具也可以执行深入的代码分析和重构之类的功能。
注释不是银弹。第一次遇到的时候,人们试图尝试各种技巧。请看下面这个从别人那里获得的建议:
public class foo { @property private int bar; }
其思想是为私有字段bar自动创建getter和setter方法。遗憾的是,这个想法有两个失败之处:1)它不能运行,2)它使代码难以阅读和处理。 它是无法实现的,因为前面已经提到了,sun特别阻止了对出现注释的类进行修改。
即使是可能的,它也不是一个好主意,因为它使代码可读性差。第一次看到这段代码的人会不知道该注释创建了方法。此外,如果将来您需要在这些方法内部执行一些操作,注释也是没用的。 总之,不要试图用注释去做那些常规代码可以完成的事情。
枚举
enum非常像public static final int声明,后者作为枚举值已经使用了很多年。对int所做的最大也是最明显的改进是类型安全――您不能错误地用枚举的一种类型代替另一种类型,这一点和int不同,所有的int对编译器来说都是一样的。除去极少数例外的情况,通常都应该用enum实例替换全部的枚举风格的int结构。
枚举提供了一些附加的特性。enummap和enumset这两个实用类是专门为枚举优化的标准集合实现。如果知道集合只包含枚举类型,那么应该使用这些专门的集合来代替hashmap或hashset。
大部分情况下,可以使用enum对代码中的所有public static final int做插入替换。它们是可比的,并且可以静态导入,所以对它们的引用看起来是等同的,即使是对于内部类(或内部枚举类型)。注意,比较枚举类型的时候,声明它们的指令表明了它们的顺序值。
“隐藏的”静态方法
两个静态方法出现在所有枚举类型声明中。因为它们是枚举子类上的静态方法,而不是enum本身的方法,所以它们在java.lang.enum的javadoc中没有出现。
第一个是values(),返回一个枚举类型所有可能值的数组。
第二个是valueof(),为提供的字符串返回一个枚举类型,该枚举类型必须精确地匹配源代码声明。
方法
关于枚举类型,我们最喜欢的一个方面是它可以有方法。过去您可能需要编写一些代码,对public static final int进行转换,把它从数据库类型转换为jdbc url。而现在则可以让枚举类型本身带一个整理代码的方法。下面就是一个例子,包括databasetype枚举类型的抽象方法以及每个枚举实例中提供的实现:
public enum databasetype { oracle { public string getjdbcurl() {...} }, mysql { public string getjdbcurl() {...} }; public abstract string getjdbcurl(); }
现在枚举类型可以直接提供它的实用方法。例如:
databasetype dbtype = ...;
string jdbcurl = dbtype.getjdbcurl();
要获取url,必须预先知道该实用方法在哪里。
可变参数(vararg)
正确地使用可变参数确实可以清理一些垃圾代码。典型的例子是一个带有可变的string参数个数的log方法:
log.log(string code) log.log(string code, string arg) log.log(string code, string arg1, string arg2) log.log(string code, string[] args)
当讨论可变参数时,比较有趣的是,如果用新的可变参数替换前四个例子,将是兼容的:
log.log(string code, string... args)
所有的可变参数都是源兼容的――那就是说,如果重新编译log()方法的所有调用程序,可以直接替换全部的四个方法。然而,如果需要向后的二进制兼容性,那么就需要舍去前三个方法。只有最后那个带一个字符串数组参数的方法等效于可变参数版本,因此可以被可变参数版本替换。
类型强制转换
如果希望调用程序了解应该使用哪种类型的参数,那么应该避免用可变参数进行类型强制转换。看下面这个例子,第一项希望是string,第二项希望是exception:
log.log(object... objects) { string message = (string)objects[0]; if (objects.length > 1) { exception e = (exception)objects[1]; // do something with the exception } }
方法签名应该如下所示,相应的可变参数分别使用string和exception声明:
log.log(string message, exception e, object... objects) {...}
不要使用可变参数破坏类型系统。需要强类型化时才可以使用它。对于这个规则,printstream.printf()是一个有趣的例外:它提供类型信息作为自己的第一个参数,以便稍后可以接受那些类型。
协变返回
协变返回的基本用法是用于在已知一个实现的返回类型比api更具体的时候避免进行类型强制转换。在下面这个例子中,有一个返回animal对象的zoo接口。我们的实现返回一个animalimpl对象,但是在jdk 1.5之前,要返回一个animal对象就必须声明。:
public interface zoo { public animal getanimal(); } public class zooimpl implements zoo { public animal getanimal(){ return new animalimpl(); } }
协变返回的使用替换了三个反模式:
- 直接字段访问。为了规避api限制,一些实现把子类直接暴露为字段:
zooimpl._animal
- 另一种形式是,在知道实现的实际上是特定的子类的情况下,在调用程序中执行向下转换:
((animalimpl)zooimpl.getanimal()).implmethod();
- 我看到的最后一种形式是一个具体的方法,该方法用来避免由一个完全不同的签名所引发的问题:
zooimpl._getanimal();
这三种模式都有它们的问题和局限性。要么是不够整洁,要么就是暴露了不必要的实现细节。
协变
协变返回模式就比较整洁、安全并且易于维护,它也不需要类型强制转换或特定的方法或字段:
public animalimpl getanimal(){
return new animalimpl();
}
使用结果:
zooimpl.getanimal().implmethod();
使用泛型
我们将从两个角度来了解泛型:使用泛型和构造泛型。我们不讨论list、set和map的显而易见的用法。知道泛型集合是强大的并且应该经常使用就足够了。
我们将讨论泛型方法的使用以及编译器推断类型的方法。通常这些都不会出问题,但是当出问题时,错误信息会非常令人费解,所以需要了解如何修复这些问题。
泛型方法
除了泛型类型,java 5还引入了泛型方法。在这个来自java.util.collections的例子中,构造了一个单元素列表。新的list的元素类型是根据传入方法的对象的类型来推断的:
static <t> list<t> collections.singletonlist(t o) 示例用法: public list<integer> getlistofone() { return collections.singletonlist(1); }
在示例用法中,我们传入了一个int。所以方法的返回类型就是list<integer>。编译器把t推断为integer。这和泛型类型是不同的,因为您通常不需要显式地指定类型参数。
这也显示了自动装箱和泛型的相互作用。类型参数必须是引用类型:这就是为什么我们得到的是list<integer>而不是list<int>。
不带参数的泛型方法
emptylist()方法与泛型一起引入,作为java.util.collections中empty_list字段的类型安全置换:
static <t> list<t> collections.emptylist() 示例用法: public list<integer> getnointegers() { return collections.emptylist(); }
与先前的例子不同,这个方法没有参数,那么编译器如何推断t的类型呢?基本上,它将尝试使用一次参数。如果没有起作用,它再次尝试使用返回或赋值类型。在本例中,返回的是list<integer>,所以t被推断为integer。
如果在返回语句或赋值语句之外的位置调用泛型方法会怎么样呢?那么编译器将无法执行类型推断的第二次传送。在下面这个例子中,emptylist()是从条件运算符内部调用的:
public list<integer> getnointegers() { return x ? collections.emptylist() : null; }
因为编译器看不到返回上下文,也不能推断t,所以它放弃并采用object。您将看到一个错误消息,比如:“无法将list<object>转换为list<integer>。”
为了修复这个错误,应显式地向方法调用传递类型参数。这样,编译器就不会试图推断类型参数,就可以获得正确的结果:
return x ? collections.<integer>emptylist() : null;
这种情况经常发生的另一个地方是在方法调用中。如果一个方法带一个list<string>参数,并且需要为那个参数调用这个传递的emptylist(),那么也需要使用这个语法。
集合之外
这里有三个泛型类型的例子,它们不是集合,而是以一种新颖的方式使用泛型。这三个例子都来自标准的java库:
- class<t>
class在类的类型上被参数化了。这就使无需类型强制转换而构造一个newinstance成为可能。 - comparable<t>
comparable被实际的比较类型参数化。这就在compareto()调用时提供了更强的类型化。例如,string实现comparable<string>。对除string之外的任何东西调用compareto(),都会在编译时失败。 - enum<e extends enum<e>>
enum被枚举类型参数化。一个名为color的枚举类型将扩展enum<color>。getdeclaringclass()方法返回枚举类型的类对象,在这个例子中就是一个color对象。它与getclass()不同,后者可能返回一个无名类。
通配符
泛型最复杂的部分是对通配符的理解。我们将讨论三种类型的通配符以及它们的用途。
首先让我们了解一下数组是如何工作的。可以从一个integer[]为一个number[]赋值。如果尝试把一个float写到number[]中,那么可以编译,但在运行时会失败,出现一个arraystoreexception:
integer[] ia = new integer[5]; number[] na = ia; na[0] = 0.5; // compiles, but fails at runtime 如果试图把该例直接转换成泛型,那么会在编译时失败,因为赋值是不被允许的: list<integer> ilist = new arraylist<integer>(); list<number> nlist = ilist; // not allowed nlist.add(0.5);
如果使用泛型,只要代码在编译时没有出现警告,就不会遇到运行时classcastexception。
上限通配符
我们想要的是一个确切元素类型未知的列表,这一点与数组是不同的。
list<number>是一个列表,其元素类型是具体类型number。
list<? extends number>是一个确切元素类型未知的列表。它是number或其子类型。
上限
如果我们更新初始的例子,并赋值给list<? extends number>,那么现在赋值就会成功了:
list<integer> ilist = new arraylist<integer>(); list<? extends number> nlist = ilist; number n = nlist.get(0); nlist.add(0.5); // not allowed
我们可以从列表中得到number,因为无论列表的确切元素类型是什么(float、integer或number),我们都可以把它赋值给number。
我们仍然不能把浮点类型插入列表中。这会在编译时失败,因为我们不能证明这是安全的。如果我们想要向列表中添加浮点类型,它将破坏ilist的初始类型安全――它只存储integer。
通配符给了我们比数组更多的表达能力。
为什么使用通配符
在下面这个例子中,通配符用于向api的用户隐藏类型信息。在内部,set被存储为customerimpl。而api的用户只知道他们正在获取一个set,从中可以读取customer。
此处通配符是必需的,因为无法从set<customerimpl>向set<customer>赋值:
public class customerfactory { private set<customerimpl> _customers; public set<? extends customer> getcustomers() { return _customers; } }
通配符和协变返回
通配符的另一种常见用法是和协变返回一起使用。与赋值相同的规则可以应用到协变返回上。如果希望在重写的方法中返回一个更具体的泛型类型,声明的方法必须使用通配符:
public interface numbergenerator { public list<? extends number> generate(); } public class fibonaccigenerator extends numbergenerator { public list<integer> generate() { ... } }
如果要使用数组,接口可以返回number[],而实现可以返回integer[]。
下限
我们所谈的主要是关于上限通配符的。还有一个下限通配符。list<? super number>是一个确切“元素类型”未知的列表,但是可能是mnumber,或者number的超类型。所以它可能是一个list<number>或一个list<object>。
下限通配符远没有上限通配符那样常见,但是当需要它们的时候,它们就是必需的。
下限与上限
list<? extends number> readlist = new arraylist<integer>(); number n = readlist.get(0); list<? super number> writelist = new arraylist<object>(); writelist.add(new integer(5));
第一个是可以从中读数的列表。
第二个是可以向其写数的列表。
无界通配符
最后,list<?>列表的内容可以是任何类型,而且它与list<? extends object>几乎相同。可以随时读取object,但是不能向列表中写入内容。
公共api中的通配符
总之,正如前面所说,通配符在向调用程序隐藏实现细节方面是非常重要的,但即使下限通配符看起来是提供只读访问,由于remove(int position)之类的非泛型方法,它们也并非如此。如果您想要一个真正不变的集合,可以使用java.util.collection上的方法,比如unmodifiablelist()。
编写api的时候要记得通配符。通常,在传递泛型类型时,应该尝试使用通配符。它使更多的调用程序可以访问api。
通过接收list<? extends number>而不是list<number>,下面的方法可以由许多不同类型的列表调用:
void removenegatives(list<? extends number> list);
构造泛型类型
现在我们将讨论构造自己的泛型类型。我们将展示一些例子,其中通过使用泛型可以提高类型安全性,我们还将讨论一些实现泛型类型时的常见问题。
集合风格(collection-like)的函数
第一个泛型类的例子是一个集合风格的例子。pair有两个类型参数,而且字段是类型的实例:
public final class pair<a,b> { public final a first; public final b second; public pair(a first, b second) { this.first = first; this.second = second; } }
这使从方法返回两个项而无需为每个两种类型的组合编写专用的类成为可能。另一种方法是返回object[],而这样是类型不安全或者不整洁的。
在下面的用法中,我们从方法返回一个file和一个boolean。方法的客户端可以直接使用字段而无需类型强制转换:
public pair<file,boolean> getfileandwritestatus(string path){ // create file and status return new pair<file,boolean>(file, status); } pair<file,boolean> result = getfileandwritestatus("..."); file f = result.first; boolean writeable = result.second;
集合之外
在下面这个例子中,泛型被用于附加的编译时安全性。通过把dbfactory类参数化为所创建的peer类型,您实际上是在强制factory子类返回一个peer的特定子类型:
public abstract class dbfactory<t extends dbpeer> { protected abstract t createemptypeer(); public list<t> get(string constraint) { list<t> peers = new arraylist<t>(); // database magic return peers; } } 通过实现dbfactory<customer>,customerfactory必须从createemptypeer()返回一个customer: public class customerfactory extends dbfactory<customer>{ public customer createemptypeer() { return new customer(); } }
泛型方法
不管想要对参数之间还是参数与返回类型之间的泛型类型施加约束,都可以使用泛型方法:
例如,如果编写的反转函数是在位置上反转,那么可能不需要泛型方法。然而,如果希望反转返回一个新的list,那么可能会希望新list的元素类型与传入的list的类型相同。在这种情况下,就需要一个泛型方法:
<t> list<t> reverse(list<t> list)
具体化
当实现一个泛型类时,您可能想要构造一个数组t[]。因为泛型是通过擦除(erasure)实现的,所以这是不允许的。
您可以尝试把object[]强制转换为t[]。但这是不安全的。
具体化解决方案
按照泛型教程的惯例,解决方案使用的是“类型令牌”,通过向构造函数添加一个class<t>参数,可以强制客户端为类的类型参数提供正确的类对象:
public class arrayexample<t> { private class<t> clazz; public arrayexample(class<t> clazz) { this.clazz = clazz; } public t[] getarray(int size) { return (t[])array.newinstance(clazz, size); } }
为了构造arrayexample<string>,客户端必须把string.class传递给构造函数,因为string.class的类型是class<string>。
拥有类对象使构造一个具有正确元素类型的数组成为可能。
结束语
总而言之,新的语言特性有助于从根本上改变java。通过了解在什么场景下使用以及如何使用这些新特性,您将会编写出更好的代码。
补充阅读
- enhancements in jdk 5――jdk 5中新特性的官方列表
- generics tutorial (pdf)――gilad bracha的泛型教程