Java List去重以及效率分析

时间：2019-10-21 20:51:03 阅读：108 评论：0 收藏：0 [点我收藏+]

List去重无非几种方法：

下面文章提供的两种：
https://blog.csdn.net/u012156163/article/details/78338574，

以及使用List.stream.distinct()。

文章中还提到了HashSet和linkHashSet，而且测试结果linkHashSet居然比hashSet还快，想了很久感觉linkedHashSet怎么可能快于hashSet，

另外网上也没有针对distinct方法的效率分析，遂自己写了个测试程序测试了下：

数据量1w，碰撞率1/10，hashset基本是1毫秒，linkedHashSet是1-2毫秒，distinct是60毫秒左右
数据量1w，碰撞率1/100，hashset基本是1-2毫秒，linkedHashSet是8-10毫秒，distinct是100毫秒左右

数据量10w时，碰撞率1/10, hashset 23毫秒，linkedHashSet是39毫秒，distinct 68毫秒。
数据量10w时，碰撞率1/100, hashset 6毫秒，linkedHashSet是11毫秒，distinct 53毫秒。

数据量100w时，碰撞率1/10, hashset 242毫秒，linkedHashSet 288毫秒，distinct 230毫秒左右。另外多次测试发现三者不相上下，有多次linkedhashSet快于hashSet
数据量100w时，碰撞率1/100, hashset 36毫秒，linkedHashSet 43毫秒，distinct 82毫秒左右。

特意跑了一下：
数据量100，碰撞率1/10，hashset两种方式均为0毫秒，distinct为60毫秒

发现当碰撞率比较高的时候，数据量大了后使用哪种方法效率都差不多。当碰撞率低的时候，hashset的效果就明显了。
看了下hashset的实现源码，最终也是通过new linkedHashSet（源码居然也是用linkedHashSet而不是hashSet，可能linkedHashSet真的优于纯粹的hashSet？）来实现的，只不过在stream框架下，可能为了可以使用parallelStream进行并发处理，外层套了mapreduce，宏观来看是有冗余操作的，
如果是单纯的去个重的话，其实有点大刀小用的意思。

一句话总结，如果单纯的只是对容器去个重的话，hashSet最快！

Java List去重以及效率分析

标签：tail 并发 uri 效率数据量左右去重比较数据

原文地址：https://www.cnblogs.com/acbingo/p/11715715.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行