码迷,mamicode.com
首页 > 其他好文 > 详细

hadoop基础

时间:2014-08-07 15:40:30      阅读:239      评论:0      收藏:0      [点我收藏+]

标签:使用   文件   数据   ar   管理   数据库   ad   file   

1 定义

hadoop是一个分布式系统架构。

2 基本模块

HDFS为海量数据提供了存储。

Map/Reduce为海量数据提供了计算。

3 子项目

Hadoop Common: 在0.20及以前的版本中,包含HDFS、MapReduce和其他项目公共内容,从0.21开始HDFS和MapReduce被分离为独立的子项目,其余内容为Hadoop Common
HDFS: Hadoop分布式文件系统(Distributed File System) - HDFS (Hadoop Distributed File System)
MapReduce:并行计算框架,0.20前使用 org.apache.hadoop.mapred 旧接口,0.20版本开始引入org.apache.hadoop.mapreduce的新API
HBase: 一个分布式的、面向列的开源数据库。(HBase和Avro已经于2010年5月成为顶级 Apache 项目)
Hive:数据仓库工具,由Facebook贡献。
Zookeeper:分布式锁设施,由Facebook贡献。
Avro:新的数据序列化格式与传输工具,将逐步取代Hadoop原有的IPC机制。
Pig: 大数据分析平台,为用户提供多种接口。
Ambari:Hadoop管理工具,可以快捷的监控、部署、管理集群。
Sqoop:于在HADOOP与传统的数据库间进行数据的传递。

hadoop基础,布布扣,bubuko.com

hadoop基础

标签:使用   文件   数据   ar   管理   数据库   ad   file   

原文地址:http://www.cnblogs.com/yanyichao/p/3897291.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!