标签:关系 挖掘 sha 机器学习 www 分布 全栈 资源管理 map
学习参考这篇文章:
http://www.shareditor.com/blogshow/?blogId=96
机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统,
hadoop用于分布式存储和map-reduce计算,
spark用于分布式机器学习,
hive是分布式数据库,
hbase是分布式kv系统,
看似互不相关的他们却都是基于相同的hdfs存储和yarn资源管理,
本文通过全套部署方法来让大家深入系统内部以充分理解分布式系统架构和他们之间的关系。
【Todo】【转载】全栈工程师-Hadoop, HBase, Hive, Spark
标签:关系 挖掘 sha 机器学习 www 分布 全栈 资源管理 map
原文地址:http://www.cnblogs.com/charlesblc/p/6014158.html