码迷,mamicode.com
首页 > 其他好文 > 详细

1. Spark Streaming概述

时间:2019-09-04 10:22:15      阅读:115      评论:0      收藏:0      [点我收藏+]

标签:stream   graph   地方   map   out   图片   ble   很多   基于   

1.1 什么是Spark Streaming

      技术图片

      Spark Streaming类似于Apache Storm,用于流式数据的处理。根据其官方文档介绍,Spark Streaming有高吞吐量和容错能力强等特点。Spark Streaming支持的数据输入源很多,例如:Kafka、Flume、Twitter、ZeroMQ和简单的TCP套接字等等。数据输入后可以用Spark的高度抽象原语如:map、reduce、join、window等进行运算。而结果也能保存在很多地方,如 HDFS,数据库等。另外Spark Streaming也能和MLlib(机器学习)以及Graphx完美融合

      技术图片

      和Spark基于RDD的概念很相似,Spark Streaming使用离散化流(discretized stream)作为抽象表示,叫作DStream。DStream是随时间推移而收到的数据的序列。在内部,每个时间区间收到的数据都作为RDD存在,而DStream是由这些RDD所组成的序列(因此得名“离散化”)

      技术图片

1.2 为什么要学习Spark Streaming 

      1. 易用

      技术图片

      2. 容错

      技术图片

      3. 易整合到Spark体系

      技术图片

1.3 Spark与Storm的对比

Spark

Storm

技术图片 技术图片

开发语言:Scala

技术图片

开发语言:Clojure

编程模型:DStream

编程模型:Spout/Bolt

技术图片
技术图片 技术图片

      

 

1. Spark Streaming概述

标签:stream   graph   地方   map   out   图片   ble   很多   基于   

原文地址:https://www.cnblogs.com/zhanghuicheng/p/11226849.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!