标签:调度 数据 sqoop 日志 分布式 资源 分布 部分 一个
狭义的Hadoop:指的是一个框架,Hadoop是由三部分组成:HDFS:分布式文件系统--》存储;MapReduce:分布式离线计算框架--》计算;Yarn:资源调度框架
广义的Hadoop:广义的Hadoop不仅仅包含Hadoop框架,除了Hadoop框架之外的一些辅助框架。Flume:日志数据采集,Sqoop:关系型数据库数据的采集;
Hive:深度依赖Hadoop框架完成计算(sql),Hbase:大数据领域的数据库(相当于web的mysql)
Sqoop:数据的导出
广义Hadoop指的是一个生态圈
标签:调度 数据 sqoop 日志 分布式 资源 分布 部分 一个
原文地址:https://www.cnblogs.com/asusdell/p/13216305.html