码迷,mamicode.com
首页 >  
搜索关键字:spark kafka    ( 10972个结果
初识Kafka
Kafka最早是由LinkedIn公司开发的,作为其自身业务消息处理的基础,后LinkedIn公司将Kafka捐赠给Apache,现在已经成为Apache的一个顶级项目了,Kafka作为一个高吞吐的分布式的消息系统,目前已经被很多公司应用在实际的业务中了,并且与许多数据处理框架相结合,比如Hadoo ...
分类:其他好文   时间:2021-07-26 16:51:13    阅读次数:0
【原创】大叔问题定位分享(40)kafka reassign卡住
kafka reassign过程详见:reassign过程 最近kafka集群发生reassign过程卡住的情况,问题发生过程如下 问题日志 2021-07-16 10:35:41,193 INFO kafka.controller.KafkaController: [Controller id=3 ...
分类:其他好文   时间:2021-07-19 16:41:55    阅读次数:0
数据积压
数据积压指的是消费者因为一些外部的IO、一些比较耗时的操作(full GC--stop the world),就会造成消息在partition中一直存在得不到消费,就会产生数据积压。 所以需要监控系统(kafka的监控系统Eagle),如果出现这种情况,需要尽快处理,虽然后续的spark strea ...
分类:其他好文   时间:2021-07-13 17:40:18    阅读次数:0
《机器学习Python实现_10_10_集成学习_xgboost_原理介绍及回归树的简单实现》
一.简介 xgboost在集成学习中占有重要的一席之位,通常在各大竞赛中作为杀器使用,同时它在工业落地上也很方便,目前针对大数据领域也有各种分布式实现版本,比如xgboost4j-spark,xgboost4j-flink等。xgboost的基础也是gbm,即梯度提升模型,它在此基础上做了进一步优化 ...
分类:编程语言   时间:2021-07-05 19:03:36    阅读次数:0
[源码解析] 深度学习分布式训练框架 horovod (9) --- 启动 on spark
Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本文是系列第九篇,介绍 horovod on spark 如何启动。 ...
分类:其他好文   时间:2021-07-05 17:30:40    阅读次数:0
Spark分析sogou日志, RDD
import com.hankcs.hanlp.HanLPimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}import scala.collection.immutable.StringO ...
分类:其他好文   时间:2021-07-02 16:33:14    阅读次数:0
sparkStreaming
import org.apache.spark.SparkConfimport org.apache.spark.streaming.{Seconds, StreamingContext}// 创建一个本地模式的StreamingContext, 两个工作线程, 1s的批处理间隔//Master要求 ...
分类:其他好文   时间:2021-07-02 16:32:11    阅读次数:0
同程旅行基于 RocketMQ 高可用架构实践
?简介: 我们在几年前决定引入 MQ 时,市场上已经有不少成熟的解决方案,比如 RabbitMQ , ActiveMQ,NSQ,Kafka 等。考虑到稳定性、维护成本、公司技术栈等因素,我们选择了 RocketMQ。 ? 背景介绍 ? 为何选择 RocketMQ ? 我们在几年前决定引入 MQ 时, ...
分类:其他好文   时间:2021-07-02 16:09:00    阅读次数:0
【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析Zeppelin简介环境安装快速开始Kotlin 开发者社区
【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析 如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么? 如果还可以执行PySpark代码和Spark代码呢?心动了吗? 如果还可以写Hive-SQL,Spark- ...
分类:编程语言   时间:2021-07-02 15:35:46    阅读次数:0
Kafka入门(一)-基础概念
https://kafka.apachecn.org/intro.html 一、kafka能做什么? 构造实时流数据管道,它可以在系统或应用之间可靠地获取数据。 (相当于message queue) 构建实时流式应用程序,对这些流数据进行转换或者影响。 (就是流处理,通过kafka stream t ...
分类:其他好文   时间:2021-07-01 17:05:23    阅读次数:0
10972条   1 2 3 4 ... 1098 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!