高效遍历Java容器
Java 程序员经常使用容器,比方 ArrayList 和 HashSet。Java 8 中的 lambda 语法和 steaming API 可以让我们更方便的使用容器。大部分情况下,我们仅仅解决几千个元素,也不会去考虑性能问题。但是,在少量极端场景下,假如我们需要遍历上百万个元素,性能问题就凸显出来了。
本文将采用 JMH 计算每块代码的运行时间。
forEach vs. C Style vs. Stream API
遍历是一个基本的功能。所有编程语言都提供了简单的语法,让程序员去遍历容器。Steam API 以一种非常直接的形式来遍历容器。
publicList?streamSingleThread(BenchMarkState state){
List?result =newArrayList<>(state.testData.size());
state.testData.stream().forEach(item -> {
result.add(item);
});
returnresult;
}
publicList?streamMultiThread(BenchMarkState state){
List?result =newArrayList<>(state.testData.size());
state.testData.stream().parallel().forEach(item -> {
result.add(item);
});
returnresult;
}
forEach 循环也很简单:
publicListforEach(BenchMarkState state){
List?result =newArrayList<>(state.testData.size());
for(Integer item : state.testData){
result.add(item);
}
returnresult;
}
C 语言形式的 for 循环啰嗦少量,不过仍然很紧凑:
publicListforCStyle(BenchMarkState state){
intsize = state.testData.size();
List?result =newArrayList<>(size);
for(intj =0; j < size; j ++){
result.add(state.testData.get(j));
}
returnresult;
}
以下是性能报告:
Benchmark Mode ?Cnt ? Score ? Error ?Units
TestLoopPerformance.forCStyle avgt20018.068±0.074ms/op
TestLoopPerformance.forEach?avgt20030.566±0.165ms/op
TestLoopPerformance.streamMultiThread ? avgt20079.433±0.747ms/op
TestLoopPerformance.streamSingleThread ?avgt20037.779±0.485ms/op
使用 C 语言形式的 for 循环,JVM 每次仅仅添加一个数字,而后直接从内存里读出数据。这使得它非常迅速。但是 forEach 就大不一样,根据 StackOverFlow 的这篇答复
(https://stackoverflow.com/questions/85190/how-does-the-java-for-each-loop-work/85206#85206),
和 Oracle 的文章
(https://docs.oracle.com/javase/1.5.0/docs/guide/language/foreach.html),
JVM 需要把 forEach 转换成一个 iterator,而后每个元素都调用一次 hasNext() 方法。这就是 forEach 比 C 语言的形式慢少量的起因。
哪一个是遍历 Set 最高效的方法呢?
我们先定义测试数据集:
@State(Scope.Benchmark)
publicstaticclassBenchMarkState{
@Setup(Level.Trial)
publicvoiddoSetup(){
for(inti =0; i <500000; i++){
testData.add(Integer.valueOf(i));
}
}
@TearDown(Level.Trial)
publicvoiddoTearDown(){
testData =newHashSet<>(500000);
}
publicSet?testData =newHashSet<>(500000);
}
Java 中的 Set 也支持 Steam API 和 forEach 循环。参考之前的测试,假如我们把 Set 转换成 ArrayList,而后遍历 ArrayList,或者许性能会好少量?
publicListforCStyle(BenchMarkState state){
intsize = state.testData.size();
List?result =newArrayList<>(size);
Integer[] temp = (Integer[]) state.testData.toArray(newInteger[size]);
for(intj =0; j < size; j ++){
result.add(temp[j]);
}
returnresult;
}
假如把 iterator 和 C 语言形式结合起来呢?
publicListforCStyleWithIteration(BenchMarkState state){
intsize = state.testData.size();
List?result =newArrayList<>(size);
Iterator?iteration = state.testData.iterator();
for(intj =0; j < size; j ++){
result.add(iteration.next());
}
returnresult;
}
或者者,简单的遍历怎样样?
publicListforEach(BenchMarkState state){
List?result =newArrayList<>(state.testData.size());
for(Integer item : state.testData) {
result.add(item);
}
returnresult;
}
这个主意不错,不过它的效率也不高,由于初始化一个新的 ArrayList 同样需要消耗资源。
Benchmark ? ? Mode ?Cnt ?Score ? Error ?Units
TestLoopPerformance.forCStyle ? ? avgt2006.013±0.108ms/op
TestLoopPerformance.forCStyleWithIteration ?avgt2004.281±0.049ms/op
TestLoopPerformance.forEach?avgt2004.498±0.026ms/op
HashMap (使用 HashMap?的 HashSet) 不是为遍历所有元素设计的。遍历一个 HashMap 最快的方法是把 Iterator 和 C 语言形式结合起来,这样 JVM 就不会去调用 hasNext()。
?为了让学习变得轻松、高效,今天给大家免费分享一套Java教学资源。帮助大家在成为Java架构师的道路上披荆斩棘。需要资料的欢迎加入学习交流群:9285,05736
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » 高效遍历Java容器