摘要:CarbonData 在 Apache Spark 和存储系统之间起到中介服务的作用,为 Spark 提供的4个重要功能。 本文分享自华为云社区《Make Apache Spark better with CarbonData》,原文作者:大数据修行者 。 Spark 无疑是一个强大的处理引擎 ...
分类:
Web程序 时间:
2021-06-30 18:44:44
阅读次数:
0
kafka它们属于消息队列;celery它们属于任务队列。 消息队列和任务队列,最大的不同之处就在于理念的不同 -- 消息队列传递的是“消息”,任务队列传递的是“任务”。 我们可以放到具体的应用场景上: 消息队列用来快速消费队列中的消息。比如日志处理场景,我们需要把不同服务器上的日志合并到一起,这时 ...
分类:
其他好文 时间:
2021-06-30 18:33:26
阅读次数:
0
kafka 应用数据读取理论生产者和消费者 生产者:生产数据 消费者:消费生产者产生的数据 对应关系:一个任务可以有多个分组,可以对应多个消费者,但消费者数量不能大于生产者分组数量,多余的也是无用的。(多对多的中的一对一关系) 特性:kafka只需写入一次,可以支持任意多的应用读取全部数据,如果应用 ...
分类:
编程语言 时间:
2021-06-30 17:51:24
阅读次数:
0
文章目录一、kafka是什么?二、使用步骤1. 安装1.引入库2.消费端:读取数据3.发送端:发送数据总结一、kafka是什么?kafka 是一个分布式流式计算平台。而在大部分企业开发人员中,都是把 kafka 当成消息系统使用,即它是一个分布式消息队列,很少会使用 kafka 的流式计算。它有四个 ...
分类:
编程语言 时间:
2021-06-30 17:50:03
阅读次数:
0
package cn.irisz.steam import org.apache.flink.api.common.RuntimeExecutionMode import org.apache.flink.streaming.api.scala._ import org.apache.flink.t ...
分类:
其他好文 时间:
2021-06-29 15:38:43
阅读次数:
0
前言 这是一篇拖更很久的博客,不知不觉InitQ在nuget下载量已经过15K了,奈何胸无点墨也不晓得怎么写(懒),随便在github上挂了个md,现在好好唠唠如何在redis里使用队列 队列缓存分布式 异步调优堆配置 (来自某位不知名码友) 诞生背景 redis在项目中使用的越来越频繁,通常我们是 ...
分类:
Web程序 时间:
2021-06-28 21:10:57
阅读次数:
0
关键点 概念的解析 kafka的架构图 架构深入 kafka的工作流程及文件存储机制 kafka的生产者:a.分区策略 b.数据可靠性保证 c.数据一致性保证 kafka的消费者:a.消费方式 b.分区分配策略 c.offset的维护 zookeeper的作用 Kafka常见面试题:根据问题去了解大 ...
分类:
其他好文 时间:
2021-06-28 18:56:22
阅读次数:
0
在前面的博客当我们讨论性能测试时,我们有聊过性能测试的目的和本质。性能测试过程中,监控分析和调优是最核心也是占比最大的一部分。 性能分析的目的是找出系统性能存在的瓶颈与风险,性能调优就是尽可能用更少的资源提供更好的服务。而其关键点,就是生成负载、监控相关指标。 性能测试前期的需求调研、开始前的准备工 ...
分类:
其他好文 时间:
2021-06-25 17:24:18
阅读次数:
0
参考集成模式 环境准备 基于docker 运行 spark 环境准备 docker run -it -p 8080:8080 datamechanics/spark:jvm-only-3.1-latest sh // 启动master /opt/spark/sbin/start-master.sh ...
分类:
其他好文 时间:
2021-06-25 16:43:35
阅读次数:
0
import it.bigdata.flink.study.SensorReding import org.apache.flink.api.common.serialization.SimpleStringSchema import org.apache.flink.streaming.api.s ...
分类:
其他好文 时间:
2021-06-25 16:39:11
阅读次数:
0