简介: 本文将会介绍Hologres基于roaringbitmap实现超高基数的UV计算 RoaringBitmap是一种压缩位图索引,RoaringBitmap自身的数据压缩和去重特性十分适合对于大数据下uv计算。其主要原理如下: 对于32bit数, RoaringBitmap会构造2^16个桶 ...
分类:
其他好文 时间:
2021-06-02 13:11:42
阅读次数:
0
I am in a bit of a bind (pun intended). I have a ubuntu server running kafka & zookeeper. This server has both ipv4 and ipv6 protocols installed. In t ...
分类:
其他好文 时间:
2021-06-02 12:29:05
阅读次数:
0
Kafka Exactly Once语义 精准一次: 将服务器的ACK级别设置为-1,可以保证Producer到Server之间不会丢失数据,即At Least Once语义。相对的,将服务器ACK级别设置为0,可以保证生产者每条消息只会被发送一次,即At Most Once语义。 At Least ...
分类:
其他好文 时间:
2021-06-02 12:21:04
阅读次数:
0
面试题: 1)Kafka中的ISR(InSyncRepli)、OSR(OutSyncRepli)、AR(AllRepli)代表什么? 2)Kafka中的HW、LEO等分别代表什么? 3)Kafka中是怎么体现消息顺序性的? 4)Kafka中的分区器、序列化器、拦截器是否了解?它们之间的处理顺序是什么 ...
分类:
其他好文 时间:
2021-06-02 12:19:54
阅读次数:
0
Kafka概述 Kafka是一个基于发布、订阅的分布式消息队列,用于大数据实时处理。 为什么要用kafka? 注册信息的过程,先在网站上填写注册信息,后台会调用其他服务的接口,反馈给网页注册成功信息,最后再显示给用户,并且将短信发送给用户,该过程为同步通信过程,需要同步等待,由于同步通信的过程比较慢 ...
分类:
其他好文 时间:
2021-06-02 12:12:15
阅读次数:
0
Nosql概述: 大数据时代,一般的数据库无法支撑 为什么要用NoSQL 用户的个人信息,社交网络,地理位置,用户自己产生的数据,用户的日志等等爆发式增长! 这时候我们需要使用NoSQL数据库,可以很好的处理以上情况 什么是NoSQL NoSQL = Not Only SQL泛指非关系型数据库 No ...
分类:
其他好文 时间:
2021-06-02 11:55:43
阅读次数:
0
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多 ...
分类:
其他好文 时间:
2021-05-25 18:15:53
阅读次数:
0
安装准备 Spark 集群和 Hadoop 类似,也是采用主从架构,Spark 中的主服务器进程就叫 Master(standalone 模式),从服务器进程叫 Worker Spark 集群规划如下: node-01:Master node-02:Worker node-03:Worker 安装步 ...
分类:
其他好文 时间:
2021-05-24 17:07:05
阅读次数:
0
启动hive时,show databases; 然后报错: 查看自己的配置文件没有问题(hbase-site.xml中配置的mysql账号信息与mysql账号信息一致),于是乎看别人的解决方法: 第一种解决办法(失败)[1]: 由于没有初始化数据库导致,执行名称初始化数据库,执行命令: schema ...
分类:
数据库 时间:
2021-05-24 16:48:31
阅读次数:
0
python 实现 kakfa 的 生产消费模式 和 发布订阅模式(已安装好 kafka 的情况下) 生产者 producer_demo.py from kafka import KafkaProducer, KafkaConsumer from kafka.errors import kafka_ ...
分类:
编程语言 时间:
2021-05-24 16:44:34
阅读次数:
0