码迷,mamicode.com
首页 > 其他好文 > 详细

Hadoop生态圈技术图谱

时间:2016-04-11 01:37:47      阅读:224      评论:0      收藏:0      [点我收藏+]

标签:

当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。
这一切,都起源自Web数据爆炸时代的来临

  1. 数据抓取系统-Nutch

  2. 海量数据怎么存,当然是用分布式文件系统-HDFS

  3. 数据怎么用呢,分析,处理MapReduce框架,让你编写代码来实现对大数据的分析工作

  4. 非结构化数据(日志)收集处理-fuse,WebDav,Chukwa,flume,scribe

  5. 数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了-Hiho,sqoop

  6. MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据-Pig,Hive,Jaql

  7. 让你的数据可见-drilldownintellicus

  8. 用高级语言管理你的任务流-ooziecascading

  9. Hadoop当然也有自己的监控管理工具-Ambari,Hue,karmasphere,eclipse plugin,Cacti,ganglia

  10. 数据序列化处理与任务调度-avrozookeeper

  11. 更多构建在Hadoop上层的服务 - MahoutElastic map Reduce

  12. OLTP存储系统-Hbase

技术分享

 

技术分享

 

技术分享


http://www.neevtech.com/blog/2013/03/18/hadoop-ecosystem-at-a-glance/ 

技术分享


http://zh.hortonworks.com/blog/modern-retail-architectures-built-hadoop/

技术分享

Hadoop生态圈技术图谱

标签:

原文地址:http://www.cnblogs.com/leetieniu2014/p/5376616.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!