Storm为分布式实时计算提供了一组通用原语,可被用于“流处理”之中,实时处理消息并更新数据库。这是管理队列及工作者集群的另一种方式。
Storm也可被用于“连续计算”(continuous
computation),对数据流做连续查询,在计算时就将结果以流的形式输出给用户。它还可被用于“分布式RPC”,以并行的方式运行昂贵的运算。
Storm可以方便地在一个计算机集群中编写与扩展复杂的实时计算,Storm用于实时处理,就好比
Hadoop
用于批处理。Storm保证每个消息都会得到处理,而且它很快——在一个小集群中,每秒可以处理数以百万计的消息。更棒的是你可以使用任意编程语言来做开发。
=====Apache Storm课程大纲=====
一、课程概述
(*)课程概述
(*)搭建Linux虚拟机环境
(*)ZooKeeper简介和环境的搭建
二、Storm概述
(*)什么是Storm和流式计算
(*)Storm的体系结构和运行机制
(*)安装配置Storm及常用命令
(*)Demo演示:WordCountTopology
三、Storm案例分析
(*)WordCount数据流程分析
(*)实现WordCountTopology
(*)部署运行WordCountTopology
四、Storm的内部原理
(*)Storm集群任务提交的流程
(*)Storm集群的内部通信机制
五、集成Storm和Apache Kafka
(*)Apache Kafka简介和环境的搭建
(*)集成Storm和Apache Kafka
六、集成Storm和Apache HDFS
(*)Apache Hadoop简介和环境的搭建
(*)集成Storm和Apache HDFS
七、集成Storm和Apache HBase
(*)Apache HBase简介和环境的搭建
(*)集成Storm和Apache HBase
八、集成Storm和Apache Hive
(*)Apache Hive简介和环境的搭建
(*)集成Storm和Apache HBase
九、集成Storm和Redis
(*)Redis简介和环境的搭建
(*)集成Storm和Redis
十、集成Storm和JDBC
(*)集成Storm和JDBC
本文出自 “我的博客” 博客,请务必保留此出处http://collen7788.blog.51cto.com/2788082/1903142
原文地址:http://collen7788.blog.51cto.com/2788082/1903142