码迷,mamicode.com
首页 > 其他好文 > 详细

更加高效的遍历 Map

时间:2021-04-30 12:08:14      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:rand   for   ror   ref   eclipse   本质   and   point   另一个   

https://stackoverflow.com/questions/46898/how-do-i-efficiently-iterate-over-each-entry-in-a-java-map

首先一起来看看,有哪些遍历 Map 的方式

1. 利用 iterator 和 Map.Entry

long i = 0;
Iterator<Map.Entry<Integer, Integer>> 
  it = map.entrySet().iterator();
while (it.hasNext()) {
    Map.Entry<Integer, Integer> pair = it.next();
    i += pair.getKey() + pair.getValue();
}

2. 利用 foreach 和Map.Entry

long i = 0;
for (Map.Entry<Integer, Integer> pair 
     : map.entrySet()) {
    i += pair.getKey() + pair.getValue();
}

3. 利用 Java 8中的foreach

这种应该算是比较常见的使用方式,也是比较容易理解的

final long[] i = {0};
map.forEach((k, v) -> i[0] += k + v);

4. 利用keySet 和 foreach

keySet: 获取 map 中所有的 key,然后依次遍历每个 key

long i = 0;
for (Integer key : map.keySet()) {
    i += key + map.get(key);
}

5. 利用keySet and iterator

long i = 0;
Iterator<Integer> itr2 = map.keySet().iterator();
while (itr2.hasNext()) {
    Integer key = itr2.next();
    i += key + map.get(key);
}

6. 利用for循环和Map.Entry

long i = 0;
for (Iterator<Map.Entry<Integer, Integer>> 
     entries = map.entrySet().iterator(); entries.hasNext(); ) {
    Map.Entry<Integer, Integer> entry = entries.next();
    i += entry.getKey() + entry.getValue();
}

7. 利用 Java8 的Stream API

这种是我平时开发中用的最多的方式,简单通俗易懂。

但是其性能如何呢?后续待揭秘。

final long[] i = {0};
map.entrySet().stream()
  .forEach(e -> i[0] += e.getKey() 
           + e.getValue());

8. 利用Java8 中的 Stream API parallel

不知道有多少人用过 Java8 中的 parallel模式,本质是一种并行处理方式。

性能如何?稍后揭晓。

final long[] i = {0};
map.entrySet().stream().parallel()
  .forEach(e -> i[0] += e.getKey() + e.getValue());

9. 利用 Apache 包的 IterableMap of

不行就找找外援试试?

long i = 0;
MapIterator<Integer, Integer> it 
  = iterableMap.mapIterator();
while (it.hasNext()) {
    i += it.next() + it.getValue();
}

10. 利用Eclipse (CS) collections 中的MutableMap

final long[] i = {0};
mutableMap.forEachKeyValue((key, value) 
           -> {i[0] += key + value;
});

性能测试

测试环境如下:Intel i7-4790 3.60 GHz, 16 GB

场景1:小数据集

测试集为小的Map集合(大约100个元素),各个方法耗时如下:

Benchmark                          Mode  Cnt  Score    Error  Units
test3_UsingForEachAndJava8         avgt  10   0.308 ±  0.021  μs/op
test10_UsingEclipseMap             avgt  10   0.309 ±  0.009  μs/op
test1_UsingWhileAndMapEntry        avgt  10   0.380 ±  0.014  μs/op
test6_UsingForAndIterator          avgt  10   0.387 ±  0.016  μs/op
test2_UsingForEachAndMapEntry      avgt  10   0.391 ±  0.023  μs/op
test7_UsingJava8StreamApi          avgt  10   0.510 ±  0.014  μs/op
test9_UsingApacheIterableMap       avgt  10   0.524 ±  0.008  μs/op
test4_UsingKeySetAndForEach        avgt  10   0.816 ±  0.026  μs/op
test5_UsingKeySetAndIterator       avgt  10   0.863 ±  0.025  μs/op
test8_UsingJava8StreamApiParallel  avgt  10   5.552 ±  0.185  μs/op

从结果看出,在数据量比较小时,利用 Java 8中的foreach 暂时领先。

场景2:中等数据集

测试集为元素数据量 1000 的 Map 集合,测试结果如下:

Benchmark                           Mode   Cnt  Score      Error   Units
test10_UsingEclipseMap              avgt   10    37.606 ±   0.790  μs/op
test3_UsingForEachAndJava8          avgt   10    50.368 ±   0.887  μs/op
test6_UsingForAndIterator           avgt   10    50.332 ±   0.507  μs/op
test2_UsingForEachAndMapEntry       avgt   10    51.406 ±   1.032  μs/op
test1_UsingWhileAndMapEntry         avgt   10    52.538 ±   2.431  μs/op
test7_UsingJava8StreamApi           avgt   10    54.464 ±   0.712  μs/op
test4_UsingKeySetAndForEach         avgt   10    79.016 ±  25.345  μs/op
test5_UsingKeySetAndIterator        avgt   10    91.105 ±  10.220  μs/op
test8_UsingJava8StreamApiParallel   avgt   10   112.511 ±   0.365  μs/op
test9_UsingApacheIterableMap        avgt   10   125.714 ±   1.935  μs/op

从结果集合看,在中等数据量情况下,外援 Eclipse (CS) collections 中的 MutableMap 表现最为优异,勇得第一。

其次为 Java 8中的 foreach,位列第二。

场景3:大数据集

测试集为元素数据量 100000(十万级别) 的 Map 集合,测试结果如下:

Benchmark                          Mode   Cnt  Score        Error    Units
test1_UsingWhileAndMapEntry        avgt   10   1184.767 ±   332.968  μs/op
test10_UsingEclipseMap             avgt   10   1191.735 ±   304.273  μs/op
test2_UsingForEachAndMapEntry      avgt   10   1205.815 ±   366.043  μs/op
test6_UsingForAndIterator          avgt   10   1206.873 ±   367.272  μs/op
test8_UsingJava8StreamApiParallel  avgt   10   1485.895 ±   233.143  μs/op
test5_UsingKeySetAndIterator       avgt   10   1540.281 ±   357.497  μs/op
test4_UsingKeySetAndForEach        avgt   10   1593.342 ±   294.417  μs/op
test3_UsingForEachAndJava8         avgt   10   1666.296 ±   126.443  μs/op
test7_UsingJava8StreamApi          avgt   10   1706.676 ±   436.867  μs/op
test9_UsingApacheIterableMap       avgt   10   3289.866 ±  1445.564  μs/op

利用 iterator 和 Map.Entry 【方法1】稳居第一,领先 第二名差不多7s。

第二名为 Eclipse (CS) collections 中的 MutableMap 位列第二,在大数据量下表现表现比较出色。

指的注意的是之前在小数据量下表现比较出色的 Java 8中的 foreach,排名却比较靠后,但是仍然超过了利用 Java8 的Stream API

其中还有另一个现象:利用并行模式计算的 Java8 中的 Stream API parallel,在大数据量时表现好于 foreach 和 stream api

总结性能

下表为不同数据量情况下的各个方法性能表现

          100     600      1100     1600     2100
test10    0.333    1.631    2.752    5.937    8.024
test3     0.309    1.971    4.147    8.147   10.473
test6     0.372    2.190    4.470    8.322   10.531
test1     0.405    2.237    4.616    8.645   10.707
test2     0.376    2.267    4.809    8.403   10.910
test7     0.473    2.448    5.668    9.790   12.125
test9     0.565    2.830    5.952   13.220   16.965
test4     0.808    5.012    8.813   13.939   17.407
test5     0.810    5.104    8.533   14.064   17.422
test8     5.173   12.499   17.351   24.671   30.403

在平时开发中,数据量都不算太大时,剖除外援而言, Java 8 中的 foreach 【方法3】,表现比较优异。而并行运算的 Stream API parallel【方法8】表现没有想象中好,Stream API【方法7】表现中规中矩。

总结

主要罗列了多种遍历 Map 的方式,每个实现方式都有各自的特点,有的人喜欢 foreach 的通俗易懂;有的人喜欢 stream 的干净利落。

如果从性能来看,小数据量情况下:优先推荐使用 Java8 Foreach【方法3】。

大数据量情况下推荐 使用 iterator 和Map.Entry【方法1】。

更加高效的遍历 Map

标签:rand   for   ror   ref   eclipse   本质   and   point   另一个   

原文地址:https://www.cnblogs.com/hanby/p/14718234.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!