码迷,mamicode.com
首页 >  
搜索关键字:samza    ( 23个结果
大数据读书笔记(2)-流式计算
早期和当前的"流式计算"系统分别称为"连续查询处理类"和"可扩展数据流平台类"计算系统。流式计算系统的特点:1)低延迟 2)极佳的系统容错性 3)极强的系统扩展能力 4)灵活强大的应用逻辑表达能力目前典型的流式计算系统:S4,storm,millwheel,samza,d-stream,hadoop...
分类:其他好文   时间:2015-11-06 12:41:43    阅读次数:302
Streaming Big Data: Storm, Spark and Samza--转载
原文地址:http://www.javacodegeeks.com/2015/02/streaming-big-data-storm-spark-samza.htmlThere are a number of distributed computation systems that can proc...
分类:其他好文   时间:2015-10-19 17:26:00    阅读次数:339
[译]从LinkedIn,Apache Kafka到Unix哲学
原文链接:http://www.confluent.io/blog/apache-kafka-samza-and-the-Unix-philosophy-of-distributed-data作者:Martin Kleppmann译者:杰微刊-macsokolot(@gmail.com) 当我在.....
分类:Web程序   时间:2015-09-14 11:51:00    阅读次数:225
流式大数据处理的三种框架:Storm,Spark和Samza
许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。Apache Storm在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(master...
分类:其他好文   时间:2015-07-02 15:29:02    阅读次数:149
流式大数据处理的三种框架:Storm,Spark和Samza
许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。Apache Storm 在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(ma...
分类:其他好文   时间:2015-04-17 07:05:30    阅读次数:152
Samza/Kafka机理解析
Apache Samza is a distributed stream processing framework. It uses Apache Kafka for messaging, and Apache Hadoop YARN to provide fault tolerance, processor isolation, security, and resource manage...
分类:其他好文   时间:2014-11-02 16:36:31    阅读次数:255
【Samza系列】实时计算Samza中文教程(四)—API概述
上一篇和大家一起宏观上学习了Samza平台的架构,重点讲了一下数据缓冲层和资源管理层,剩下的一块很重要的SamzaAPI层本节作为重点为大家展开介绍。     当你使用Samza来实现一个数据流处理逻辑时,你必须实现一个叫StreamTask的接口,如下所示: public class MyTaskClass implements StreamTask { public void...
分类:Windows程序   时间:2014-10-30 13:31:26    阅读次数:288
【Samza系列】实时计算Samza中文教程(三)——架构
本篇紧接着概念篇,从宏观角度上看一下Samza实时计算服务的架构是什么样的?     Samza是由以下三层构成:     1. 数据流层(A streaming layer)     2. 执行层(An execution layer)     3. 处理层(A progressing layer)     那Samza是依靠哪些技术完成以上三层的组合呢...
分类:其他好文   时间:2014-10-29 17:11:57    阅读次数:261
实时计算Samza中文教程(一)背景
大家应该听我在前言篇里扯皮后,迫不及待要来一看Samza究竟是何物了吧?先了解一下Samza的Background是必不可少的(至少官网上是放在第一个的),我们需要从哪些技术背景去了解呢?     什么是消息(Messaging)?     消息系统是一种实现近实时异步计算的流行方案。消息产生时可以被放入一个消息队列(ActiveMQ,RabbitMQ)、发布-订阅系统(Kestrel...
分类:其他好文   时间:2014-10-27 23:10:44    阅读次数:349
实时计算Samza中文教程(二)——概念
希望上一篇背景篇让大家对流式计算有了宏观的认识,本篇根据官网是介绍概念,先让我们看看有哪些东西呢?     概念一:Streams     Samza是处理流的。流则是由一系列不可变的一种相似类型的消息组成。举个例子,一个流可能是在一个网站上的所有点击,或者更新到一个特定数据库表的更新操作,或者是被一个服务或者事件数据生成所有日志信息。消息能够被加到另一个流之后或者从一个流中读取。一个...
分类:其他好文   时间:2014-10-27 23:05:34    阅读次数:699
23条   上一页 1 2 3 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!