码迷,mamicode.com
首页 > 其他好文 > 详细

Hadoop学习笔记系列文章导游【持续更新中...】

时间:2015-04-20 01:44:41      阅读:140      评论:0      收藏:0      [点我收藏+]

标签:

一、为何要学习Hadoop?

技术分享

  这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急。但数据增长的速度往往比cpu和内存性能增长的速度还要快得多。要处理海量数据,如果求助于昂贵的专用主机甚至超级计算机,成本无疑很高,有时即使是保存数据,也需要面对高成本的问题,因为具有海量数据容量的存储设备,价格往往也是天文数字。成本和IT能力成为了海量数据分析的主要瓶颈。

技术分享

  Hadoop这个开源产品的出现,打破了对数据力量的压制。Hadoop源于Nutch这个小型的搜索引擎项目。而Nutch则出自于著名的开源搜索引擎解决方案Lucene,而Lucene则来源于对Google的学习模仿。在Hadoop身上有着明显的Google的影子。HDFS是GFS的山寨版,Map-Reduce的思想来源于Goolge对Page rank的计算方法,HBase模仿的是Big Table,Zookeeper则学习了Chubby。Google巨人的力量尽管由于商业的原因被层层封锁,但在Hadoop身上得到了完美的重生和发展。

  2006Apache基金会接纳Hadoop项目以来。Hadoop已经成为云计算软件的一个事实标准,以及开源云计算解决方案的几乎唯一选择。对于想用低成本(包括软硬件)实现云计算平台或海量数据分析平台的用户,Hadoop集群是首选的对象。由于Hadoop在各方面都打破了传统关系型数据库的思路和模式,对于新接触Hadoop平台的人,往往会觉得困惑和难以理解,进而转化为畏惧。

  因此,为了赶上大数据时代的发展,迎接云计算的思维,尽管我做的是.NET的应用开发工作,但我仍然选择业余时间学习Hadoop。我会从基础版本1.1.2开始学习经典的HDFS与MapReduce,然后了解Hadoop2.x版本与老版本的差异,熟悉一些常见的Hadoop应用场景,并学着实践一个最经典的项目(网站项目日志分析案例)来完成我给自己规划的学习任务。

二、Hadoop笔记系列索引

2.1 基础环境部分:

  (1)基础介绍与环境搭建:http://www.cnblogs.com/edisonchou/p/3485135.html

  (6)Hadoop Eclipse插件的使用:http://www.cnblogs.com/edisonchou/p/4297521.html

  (13)分布式集群中节点的动态添加与下架:http://www.cnblogs.com/edisonchou/p/4302477.html

2.2 HDFS部分:

  (2)不怕故障的海量存储之HDFS基础入门:http://www.cnblogs.com/edisonchou/p/3538524.html

  (3)Hadoop RPC机制的使用:http://www.cnblogs.com/edisonchou/p/4285817.html

2.3 MapReduce部分:

  (4)初识MapReduce:http://www.cnblogs.com/edisonchou/p/4287784.html

  (5)自定义类型处理手机上网日志:http://www.cnblogs.com/edisonchou/p/4288737.html

  (7)计数器与自定义计数器:http://www.cnblogs.com/edisonchou/p/4297599.html

  (8)Combiner与自定义Combiner:http://www.cnblogs.com/edisonchou/p/4297786.html

  (9)Partioner与自定义Partitioner:http://www.cnblogs.com/edisonchou/p/4297828.html

  (10)Reduce阶段中的Shuffle过程:http://www.cnblogs.com/edisonchou/p/4298423.html

  (11)MapReduce中的排序和分组:http://www.cnblogs.com/edisonchou/p/4299085.html

  (12)MapReduce中的常见算法:http://www.cnblogs.com/edisonchou/p/4299950.html

2.4 ZooKeeper部分:

  (14)ZooKeeper环境搭建:http://www.cnblogs.com/edisonchou/p/4303031.html

2.5 HBase部分:

  (15)HBase框架学习之基础知识篇:http://www.cnblogs.com/edisonchou/p/4405442.html

  (15)HBase框架学习之基础实践篇:http://www.cnblogs.com/edisonchou/p/4405906.html

2.6 Pig部分:

  (16)Pig框架学习:http://www.cnblogs.com/edisonchou/p/4413347.html

2.7 Hive部分:

  (17)Hive框架学习:http://www.cnblogs.com/edisonchou/p/4426096.html

2.8 Sqoop部分:

  (18)Sqoop框架学习:http://www.cnblogs.com/edisonchou/p/4440216.html

2.9 Flume部分:

2.10 项目实战部分:

2.11 Hadoop2基础部分:

 

Hadoop学习笔记系列文章导游【持续更新中...】

标签:

原文地址:http://www.cnblogs.com/edisonchou/p/4440107.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!