标签:mapreduce datanode 发行版 问题 海量数据存储 hdf ted map 处理
hadoop是什么?
是一个分布式基础架构,主要解决海量数据存储以及数据分析计算问题。
hadoop三大发行版本?
Apache、clourdera、Hortonworks
hadoop优势?
高可靠、高扩展、高效、高容错
hadoop1.x和2.x的区别?
HDFS(hadoop distributed file system) 是什么?
NameNode(目录)、DataNode(数据)、Second DataNode
Yam是什么?
‘
MapReduce是什么?
Map:用于分布处理数据。
Reduce:用于将处理的结果合并。
标签:mapreduce datanode 发行版 问题 海量数据存储 hdf ted map 处理
原文地址:https://www.cnblogs.com/xiximayou/p/12242529.html