Java 8 有哪些新特性以及改进表
这抟庖汨甲篇文章是对Java 8中即将到来的改进做一个面向开发者的综合性的总结,JDK的这一特性瓴烊椹舟将会在2013年9月份发布。
在过去,java类库的接口中添加方法基本上是不可能的. 在接口中添加方法意味着破坏了实现了这个接口的代码. 但是现在, 只要能够提供一个正确明智的默认的方法的实现, java类库的维护者就可以在接口中添加方法.
Java 8中, 大量的默认方法已经被添加到核心的JDK接口中了. 稍候我会详细介绍它们.
为什么不能用默认方法来重载equals,hashCode和toString?
接口不能提供对Object类的任何方法的默认实现。特别是,这意味着从接口里不能提供对equals,hashCode或toString的默认实现。
这刚看起来挺奇怪的,但考虑到一些接口实际上是在文档里定义他们的equals行为的。List接口就是一个例子了。因此,为什么不允许这样呢?
Brian Goetz在这个问题上的冗长的回复里给出了4个原因。我这里只说其中一个,因为那个已经足够说服我了:
它会变得更困难来推导什么时候该调用默认的方法。现在它变得很简单了:如果一个类实现了一个方法,那总是优先于默认的实现的。一旦所有接口的实例都是Object的子类,所有接口实例都已经有对equals/hashCode/toString的非默认实现。因此,一个在接口上这些的默认版本都是没用的,它也不会被编译。
要看更多的话,看下由Brian Goetz写的解释: 对“允许默认方法来重载Object的方法”的回复
函数式接口
Java 8 引入的一个核心概念是函数式接口。如果一个接口定义个唯一一个抽象方法,那么这个接口就成为函数式接口。比如,java.lang.Runnable就是一个函数式接口,因为它只顶一个一个抽象方法:
你可以想出一些函数引用格式作为其他lambda格式的简写。
一个Runnable的run方法不需要参数也不会返回值。这和lambda右侧一致,所以任务有效。
在抽象方法的签名里的受检查异常(如果存在)也很重要。如果函数式接口在它的签名里声明了异常,lambda只能抛出受检查异常。
捕获和非捕获的Lambda表达式
当Lambda表达式访问一个定义在Lambda表达式体外的非静态变量或者对象时,这个Lambda表达式称为“捕获的”。比如,下面这个lambda表达式捕捉了变量x:
进一步阅读关于这些问题的资料,看看这篇Brian Goetz写的说明:在 Block<T>中响应“已验证例外”
为什么抽象类不能通过利用lambda实例化
抽象类,哪怕只声明了一个抽象方法,也不能使用lambda来实例化。
下面有两个类 Ordering 和 CacheLoader的例子,都带有一个抽象方法,摘自于Guava 库。那岂不是很高兴能够声明它们的实例,像这样使用lambda表达式?
要深入阅读,请参看由 Brian Goetz所做的说明: response to “Allow lambdas to implement abstract classes”。
java.util.function
包概要:java.util.function
作为Comparator 和Runnable早期的证明,在JDK中已经定义的接口恰巧作为函数接口而与lambdas表达式兼容。同样方式可以在你自己的代码中定义任何函数接口或第三方库。
但有特定形式的函数接口,且广泛的,通用的,在之前的JD卡中并不存在。大量的接口被添加到新的java.util.function 包中。下面是其中的一些:
Function<T, R> -T作为输入,返回的R作为输出
Predicate<T> -T作为输入,返回的boolean值作为输出
Consumer<T> - T作为输入,执行某种动作但没有返回值
Supplier<T> - 没有任何输入,返回T
BinaryOperator<T> -两个T作为输入,返回一个T作为输出,对于“reduce”操作很有用
这些最原始的特征同样存在。他们以int,long和double的方式提供。例如:
IntConsumer -以int作为输入,执行某种动作,没有返回值
这里存在性能上的一些原因,主要释在输入或输出的时候避免装箱和拆箱操作。
java.util.stream
包汇总: java.util.stream
注意:上面的代码使用了一个原始的流,以及一个只能用在原始流上的sum()方法。下面马上就会有更多关于原始流的细节。
流提供了流畅的API,可以进行数据转换和对结果执行某些操作。流操作既可以是“中间的”也可以是“末端的”。
中间的 -中间的操作保持流打开状态,并允许后续的操作。上面例子中的filter和map方法就是中间的操作。这些操作的返回数据类型是流;它们返回当前的流以便串联更多的操作。
末端的 - 末端的操作必须是对流的最终操作。当一个末端操作被调用,流被“消耗”并且不再可用。上面例子中的sum方法就是一个末端的操作。
通常,处理一个流涉及了这些步骤:
从某个源头获得一个流。
执行一个或更多的中间的操作。
执行一个末端的操作。
可能你想在一个方法中执行所有那些步骤。那样的话,你就要知道源头和流的属性,而且要可以保证它被正确的使用。你可能不想接受任意的Stream<T>实例作为你的方法的输入,因为它们可能具有你难以处理的特性,比如并行的或无限的。
有几个更普通的关于流操作的特性需要考虑:
有状态的 - 有状态的操作给流增加了一些新的属性,比如元素的唯一性,或者元素的最大数量,或者保证元素以排序的方式被处理。这些典型的要比无状态的中间操作代价大。
短路 - 短路操作潜在的允许对流的操作尽早停止,而不去检查所有的元素。这是对无限流的一个特殊设计的属性;如果对流的操作没有短路,那么代码可能永远也不会终止。
对每个Sttream方法这里有一些简短的,一般的描述。查阅javadoc获取更详尽的解释。下面给出了每个操作的重载形式的链接。
中间的操作:
filter1 - 排除所有与断言不匹配的元素。
map1234 - 通过Function对元素执行一对一的转换。
flatMap12345 - 通过FlatMapper将每个元素转变为无或更多的元素。
peek1 - 对每个遇到的元素执行一些操作。主要对调试很有用。
distinct1 - 根据.equals行为排除所有重复的元素。这是一个有状态的操作。
sorted12 - 确保流中的元素在后续的操作中,按照比较器(Comparator)决定的顺序访问。这是一个有状态的操作。
limit1 - 保证后续的操作所能看到的最大数量的元素。这是一个有状态的短路的操作。
substream12 - 确保后续的操作只能看到一个范围的(根据index)元素。像不能用于流的String.substring一样。也有两种形式,一种有一个开始索引,一种有一个结束索引。二者都是有状态的操作,有一个结束索引的形式也是一个短路的操作。
末端的操作:
forEach1 - 对流中的每个元素执行一些操作。
toArray12 - 将流中的元素倾倒入一个数组。
reduce123 - 通过一个二进制操作将流中的元素合并到一起。
collect12 - 将流中的元素倾倒入某些容器,例如一个Collection或Map.
min1 - 根据一个比较器找到流中元素的最小值。
max1 -根据一个比较器找到流中元素的最大值。
count1 - 计算流中元素的数量。
anyMatch1 - 判断流中是否至少有一个元素匹配断言。这是一个短路的操作。
allMatch1 - 判断流中是否每一个元素都匹配断言。这是一个短路的操作。
noneMatch1 - 判断流中是否没有一个元素匹配断言。这是一个短路的操作。
findFirst1 - 查找流中的第一个元素。这是一个短路的操作。
findAny1 - 查找流中的任意元素,可能对某些流要比findFirst代价低。这是一个短路的操作。
如 javadocs中提到的 , 中间的操作是延迟的(lazy)。只有末端的操作会立即开始流中元素的处理。在那个时刻,不管包含了多少中间的操作,元素会在一个传递中处理(通常,但并不总是)。(有状态的操作如sorted() 和distinct()可能需要对元素的二次传送。)
流试图尽可能做很少的工作。有一些细微优化,如当可以判定元素已经有序的时候,省略一个sorted()操作。在包含limit(x) 或 substream(x,y)的操作中,有些时候对一些不会决定结果的元素,流可以避免执行中间的map操作。在这里我不准备实现公平判断;它通过许多细微的但却很重要的方法表现得很聪明,而且它仍在进步。
回到并行流的概念,重要的是要意识到并行不是毫无代价的。从性能的立场它不是无代价的,你不能简单的将顺序流替换为并行流,且不做进一步思考就期望得到相同的结果。在你能(或者应该)并行化一个流以前,需要考虑很多特性,关于流、它的操作以及数据的目标方面。例如:访问顺序确实对我有影响吗?我的函数是无状态的吗?我的流有足够大,并且我的操作有足够复杂,这些能使得并行化是值得的吗?
有针对int,long和double的专业原始的Stream版本:
IntStream
LongStream
DoubleStream
可以在众多函数中,通过专业原始的map和flatMap函数,在一个stream对象与一个原始stream对象之间来回转换。给几个虚设例子:
123456List<String> strings = Arrays.asList("a", "b", "c");strings.stream() // Stream<String> .mapToInt(String::length) // IntStream .longs() // LongStream .mapToDouble(x -> x / 10.0) // DoubleStream .boxed() // Stream<Double> .mapToLong(x -> 1L) // LongStream .mapToObj(x -> "") // Stream<String> ...
原始的stream也为获得关于stream的基础数据统计提供方法,那些stream是指作为数据结构的。你可以发现count, sum, min, max, 以及元素平均值全部是来自于一个终端的操作。
原始类型的剩余部分没有原始版本,因为这需要一个不可接受的JDK数量的膨胀。IntStream, LongStream, 和 DoubleStream被认为非常有用应当被包含进去,其他的数字型原始stream可以由这三个通过扩展的原始转换来表示。
在flatMap操作中使用的 FlatMapper 接口是具有一个抽象方法的功能性接口:
1voidflattenInto(T element, Consumer<U> sink);
在一个flatMap操作的上下文中,stream为你提供element和 sink,然后你定义该用element 和 sink做什么。element是指在stream中的当前元素,而sink代表当flatMap操作结束之后在stream中应该显示些什么。例如:
12345678Set<Color> colors = ...;List<Person> people = ...;Stream<Color> stream = people.stream().flatMap((Person person, Consumer<Color> sink) -> { // Map each person to the colors they like. for (Color color : colors) { if (person.likesColor(color)) {sink.accept(color);}}});
注意上面lambda中的参数类型是指定的。在大多数其它上下文中,你可以不需要指定类型,但这里由于FlatMapper的自然特性,编译器需要你帮助判定类型。如果你在使用flatMap又迷惑于它为什么不编译,可能是因为你没有指定类型。
最令人感到困惑,复杂而且有用的终端stream操作之一是collect。它引入了一个称为Collector的新的非功能性接口。这个接口有些难理解,但幸运的是有一个Collectors工具类可用来产生所有类型的有用的Collectors。例如:
1234List<String> strings = values.stream().filter(...).map(...).collect(Collectors.toList());
如果你想将你的stream元素放进一个Collection,Map或String,那么Collectors可能具有你需要的。在javadoc中浏览那个类绝对是值得的。
泛型接口改进
建议摘要:JEP 101: 通用化目标-Type 接口
这是一个以前不能做到的,对编译器判定泛型能力的努力改进。在以前版本的Java中有许多情形编译器不能给某个方法计算出泛型,当方法处于嵌套的或串联方法调用这样的上下文的时候,即使有时候对程序员来说它看起来“很明显”。那些情况需要程序员明确的指定一个“类型见证”(type witness)。它是一种通用的特性,但吃惊的是很少有Java程序员知道(我这么说是基于私下的交流并且阅读了一些StackOverflow的问题)。它看起来像这样:
12// In Java 7: foo(Utility.<Type>bar());Utility.<Type>foo().bar();
如果没有类型见证,编译器可能会将<Object>替代为泛型,而且如果需要的是一个更具体的类型,代码将编译失败。
Java 8 极大的改进了这个状况。在更多的案例中,它可以基于上下文计算出更多的特定的泛型类型。
12// In Java 8: foo(Utility.bar());Utility.foo().bar();
这项工作仍在发展中,所以我不确定建议中列出的例子有多少能真正包含进Java 8。希望是它们全部。