码迷,mamicode.com
首页 > 其他好文 > 详细

Hadoop入门学习路线

时间:2018-09-17 10:24:47      阅读:119      评论:0      收藏:0      [点我收藏+]

标签:pac   mapred   zookeeper   程序   分享   net   png   基于   分布式计算   

走上大数据的自学之路....,Hadoop是走上大数据开发学习之路的第一个门槛。

Hadoop,是Apache的一个开源项目,开发人员可以在不了解分布式底层细节,开发分布式程序,充分利用集群进行高速运算和存储海量数据。

核心:分布式存储系统HDFS(Hadoop Distributed File System) 和 MapReduce

HDFS为海量数据提供存储,MapReduce为海量数据提供分布式计算

 

Hadoop的学习路线

技术分享图片

 1、Hadoop环境的搭建(单机、伪分布式、集群、HA高可用集群)

 2、Hadoop分布式系统HDFS

 3、MapReduce(经典MapReduce1 和 基于YARN系统的MapReduce2的区别)

 4、Hadoop I/O (了解MapReduce程序参数)(Avor 数据序列化系统)

 5、Yarn系统(MapReduce 2中核心系统)

 6、做一个简单的Hadoop案例(开发MapReduce程序)

 7、Hbase、Zookeeper

 8、Hive

 9、Flume

 10、Sqoop

 11、Mahout

 12、Spark、SparkSQL

 13、Kafka、Storm

 

个人参考这篇博客:https://blog.csdn.net/jiangzhexi/article/details/56037170

Hadoop入门学习路线

标签:pac   mapred   zookeeper   程序   分享   net   png   基于   分布式计算   

原文地址:https://www.cnblogs.com/xiaojianfeng/p/9648152.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!