搜索关键字：布隆，搜索到206个结果！码迷,mamicode.com！

从另一个角度看大数据量处理利器布隆过滤器

思路：从简单的排序谈到BitMap算法，再谈到数据去重问题，谈到大数据量处理利器：布隆过滤器。情景1：对无重复的数据进行排序 @给定数据（2，4，1，12，9，7，6）如何对它排序？方法1：基本的排序方法包括冒泡，快排等。方法2：使用BitMap算法方法1就不介绍了，方法2中所谓的BitMa ...

分类：其他好文时间：2019-02-25 18:48:05 阅读次数：143

Python 三种过滤去重方法

SET集合去重 set(1,1,2) REDIS去重布隆过滤器 ...

分类：编程语言时间：2019-02-20 20:13:57 阅读次数：194

hbase建表create高级属性 //hbase 表预分区也就是手动分区这个很重要

2019/2/19星期二hbase建表create高级属性//hbase表预分区也就是手动分区这个很重要下面几个shell命令在后续的hbase操作中可以起到很到的作用，且主要体现在建表的过程中，看下面几个create属性1、BLOOMFILTER默认是NONE是否使用布隆过虑使用何种方式布隆过滤可以每列族单独启用。使用HColumnDescriptor.setBloomFilterType(NO

分类：其他好文时间：2019-02-19 20:07:29 阅读次数：343

算法初级面试题05——哈希函数/表、生成多个哈希函数、哈希扩容、利用哈希分流找出大文件的重复内容、设计RandomPool结构、布隆过滤器、一致性哈希、并查集、岛问题

今天主要讨论：哈希函数、哈希表、布隆过滤器、一致性哈希、并查集的介绍和应用。今天主要讨论：哈希函数、哈希表、布隆过滤器、一致性哈希、并查集的介绍和应用。题目一题目一认识哈希函数和哈希表 1、输入无限大 2、输出有限的S集合 3、输入什么就输出什么 4、会发生哈希碰撞 5、会均匀分布，哈希函数 ...

分类：编程语言时间：2019-01-28 14:05:20 阅读次数：204

用Python实现一个大数据搜索引擎

搜索是大数据领域里常见的需求。Splunk和ELK分别是该领域在非开源和开源领域里的领导者。本文利用很少的Python代码实现了一个基本的数据搜索功能，试图让大家理解大数据搜索的基本原理。布隆过滤器（Bloom Filter）第一步我们先要实现一个布隆过滤器。布隆过滤器是大数据领域的一个常见 ...

分类：编程语言时间：2019-01-24 13:22:49 阅读次数：218

redis的学习

一、布隆过滤器：首先定义一些变量： k:为hash函数的数量 m:bit数组的大小 n:为元素的数量 ...

分类：其他好文时间：2019-01-19 12:21:15 阅读次数：162

布隆过滤的代码

# -*- coding: utf-8 -*- import redis from hashlib import md5 class SimpleHash(object): def __init__(self, cap, seed): self.cap = cap self.seed = seed ... ...

分类：其他好文时间：2019-01-11 17:11:25 阅读次数：142

大数据处理系统都有哪些？(数据查询分析计算系统篇)

大数据的出现使得数据的处理效率提高不少，这得益于大数据的数据处理系统，而大数据的处理系统有很多。就目前而言，主要的大数据处理系统有数据查询分析计算系统、批处理系统、流式计算系统、迭代计算系统、图计算系统和内存计算系统。下面我们就给大家介绍一下数据查询分析计算系统。 ...

分类：其他好文时间：2019-01-04 14:33:51 阅读次数：565

url去重 --布隆过滤器 bloom filter原理及python实现

https://blog.csdn.net/a1368783069/article/details/52137417 ...

分类：编程语言时间：2018-12-13 21:46:50 阅读次数：330

[原创]大数据:布隆过滤器C#版简单实现。

结果：使用内存27MB，查找结果一般在100毫秒以内。 ...

分类：Windows程序时间：2018-11-29 15:07:04 阅读次数：215

共206条上一页 1 ... 7 8 9 10 11 ... 21 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)