码迷,mamicode.com
首页 > 其他好文 > 详细

bloomfilter 以及count min sketch

时间:2018-01-04 14:26:35      阅读:228      评论:0      收藏:0      [点我收藏+]

标签:简单   tab   csdn   取出   估值   height   递增   min   计算   

bloomfilter

http://blog.csdn.net/v_july_v/article/details/6685894

count min sketch

http://www.cnblogs.com/fxjwind/p/3289221.html

这个方法比较简单, 原理就是, 使用二维的hash table, w是hash table的取值空间, d是hash函数的个数 
对某个element, 分别使用d个hash函数计算相应的hash值, 并在对应的bucket上递增1, 每个bucket的值称为sketch, 如图 
然后在查询某个element的frequency时, 只需要取出所有d个sketch, 然后取最小的那个作为预估值, 如其名

因为为了节省空间, w*d是远小于真正的element个数的, 所以必然会出现很多的冲突, 而最小的那个应该是冲突最少的, 最精确的那个

这个方法的思路和bloom filter比较类似, 都是通过多个hash来降低冲突带来的影响

技术分享图片

bloomfilter 以及count min sketch

标签:简单   tab   csdn   取出   估值   height   递增   min   计算   

原文地址:https://www.cnblogs.com/zafu/p/8192619.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!