如何在分布式集群中,充分利用多节点,对大数据进行拆分,实现并行计算,“parallel computing by kafka-storm ” 提供了一种很好的思路。...
分类:
其他好文 时间:
2014-12-29 23:03:01
阅读次数:
208
1 应用背景: 需要实时统计用户的登陆数,在线人数,活跃时间,下载等指标的数据,或者清洗后移到hdfs上。
2 设计架构:
1) 客户端产生数据---
2) kafka-生产者实时采集数据(保留7天)-----
3) storm实时消费数据,处理数据
4)把实时数据统计结果缓存到memcached 中...
分类:
其他好文 时间:
2014-12-29 23:01:45
阅读次数:
235
简单介绍了storm现有的调度算法,以及一些其他公司或研究组织对其的改进...
分类:
编程语言 时间:
2014-12-28 00:32:11
阅读次数:
238
作为storm的使用者,有两件事情要做以更好的利用storm的可靠性特征。 首先,在你生成一个新的tuple的时候要通知storm; 其次,完成处理一个tuple之后要通知storm。 这样storm就可以检测整个tuple树有没有完成处理...
分类:
其他好文 时间:
2014-12-25 16:37:15
阅读次数:
188
深入理解Magento作者:Alan Storm 翻译:Hailong Zhang第六章 – 高级Magento模型我们讲过Magento有两种模型,简单模型和EAV(Entity Attribute Value)模型。上一章我们讲过所有的Magento模型都是继承自Mage_Core_Model....
分类:
其他好文 时间:
2014-12-22 12:44:30
阅读次数:
283
There are two kinds of nodes on a Storm cluster: the master node and the worker nodes.有两种节点,主节点和worker节点主节点,Nimbus:Nimbus is responsible for distribut...
分类:
其他好文 时间:
2014-12-22 11:04:29
阅读次数:
140
Why use netty as transport instead of zeromq in Storm...
分类:
Web程序 时间:
2014-12-18 22:19:05
阅读次数:
249
spark 、storm提供了向Cassandra直接存储数据的功能。但是国内对Cassandra本身的源码研究不深,参考资料较少。我将最近研究的源码分析贴上,和大家一起共享。...
分类:
其他好文 时间:
2014-12-18 18:49:24
阅读次数:
226
1 Topology构成 和同样是计算框架的Mapreduce相比,Mapreduce集群上运行的是Job,而Storm集群上运行的是Topology。但是Job在运行结束之后会自行结束,Topology却只能被手动的kill掉,否则会一直运行下去。 Storm集群中有两种节点,一种是控制节点(Ni...
分类:
其他好文 时间:
2014-12-18 11:56:38
阅读次数:
180
开始之前,首先声明下,Magento开发者手册由Alan Storm发表在Magento官方网站上。总共分八个部分,由浅入深的介绍了Magento的MVC架构及Magento中使用的比较特殊的EAV模型。虽然英文文档读起来没有问题,但是真想看一遍能有一定深入的了解, 还是中文看着比较舒服。并且在网上...
分类:
其他好文 时间:
2014-12-17 20:22:37
阅读次数:
370