标签:
一个开源的,高可靠,可扩展的分布式计算框架
解决的问题
1 海量数据的存储(HDFS)
2海量数据的分析(Mapreduce)
3 分布式资源调度 (Yarn)
应用场景
日志分析,基于海量数据的在线应用,推荐系统,计算广告,复杂算法,网盘,搜素引擎,,,,
一 HDFS
动态增加,自动备份
二 mapreduce
分而治之,并行计算框架
三 Yarn
CPU 内存的分配,资源调度和任务调度管理
标签:
原文地址:http://www.cnblogs.com/yuanfuqiang/p/5879787.html