标签:需要 ack 误差 任务 标准 color 目的 set 组元
Hyperloglog是基数统计类型(取出一组数里面不重复的元素的个数,也就是去重后计数)
优点:占用内存是固定的,2的64次方个数的不同元素的基数,只需要废12KB内存,如果要从内存角度来比较的话Hyperloglog是首选
网页的UV(一个人访问一个网页多次,但是还是算作一个人)
传统的方式,set保存用户id,然后就可以统计set中元素数量作为标准判断
但是在这个方式如果保存大量的用户,就会比较麻烦!我们的目的是为了计数,而不是保存用户id;
0.81%误差率,统计UV任务,可以忽略不计
127.0.0.1:6379> PFADD mykey a b c d e f (创建第一组元素并添加元素)
(integer) 1
127.0.0.1:6379> PFCOUNT mykey (计数第一组元素基数数量)
(integer) 6
127.0.0.1:6379> PFADD mykey2 a c g h i j
(integer) 1
127.0.0.1:6379> PFMERGE mykey3 mykey mykey2 (合并两组数到一组新数,并集 ) mykey mykey2 =>mykey3 并集
OK
127.0.0.1:6379> PFCOUNT mykey3 (计数)
(integer) 10
标签:需要 ack 误差 任务 标准 color 目的 set 组元
原文地址:https://www.cnblogs.com/whs123/p/14160596.html