码迷,mamicode.com
首页 > 其他好文 > 详细

Hadoop介绍

时间:2018-05-19 20:35:30      阅读:243      评论:0      收藏:0      [点我收藏+]

标签:常用工具   bat   base   资源管理   mahout   mapreduce   yarn   span   spark   

一:来源

    雅虎--->谷歌两篇论文GFS,mapreduce。

二:组成

    hadoop common:支持其他Hadoop模块的常用工具。 

     HDFS:分布式文件系统,提供对应用程序数据的高吞吐量访问。全称:Hadoop Distributed File System。

    hadoop yarn:作业调度和集群资源管理的框架。

    hadoop mapreduce:基于YARN的大型数据集并行处理系统。

    Apache的其他Hadoop相关项目包括:Ambari?Avro?Cassandra?Chukwa?HBase?Hive?Mahout?Pig?Spark?Tez?ZooKeeper?

三:hadoop是可靠的可扩展的分布式计算软件,还有一点是高性能的,他需要其他的软件的共同来实现这个特性。

Hadoop介绍

标签:常用工具   bat   base   资源管理   mahout   mapreduce   yarn   span   spark   

原文地址:https://www.cnblogs.com/lyr999736/p/9061384.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!