标签:href mapreduce 12月 邮件 分布式协调服务 企业版 管理 oop 发行版
这本书由宋立桓老师和陈建平老师共同合作,本书的切入点明确而清晰,从Hadoop 生态明星 Cloudera 入手,单刀直入逐步引出各类大数据基础和核心应用框架。 全书系统介绍了大数据的相关知识,全书共十八章(宋立桓老师撰写第一章到第十二章、陈建平撰写第十三章到第十八章),从大数据概述、Cloudera hadoop平台的安装部署、并对大数据hadoop组件分别进行介绍,包括HDFS分布式文件系统、MapReduce计算框架、资源管理框架YARN 、hive数据仓库、数据迁移工具Sqoop、分布式数据库HBase、Zookeeper分布式协调服务、准实时分析系统Impala、分布式消息系统Kafka、ETL工具Kettle、Spark计算框架等知识,最后有两个综合实操案例把所有知识点串起来。本书使用的操作环境是hadoop的商业发行版的Cloudera express(express是免费版本,企业版需付费),全书秉承“实践为主、理论够用”,将演示实验融入到各个知识点讲解中。《Cloudera hadoop大数据平台实战指南》此书预计2018年12月底上市
标签:href mapreduce 12月 邮件 分布式协调服务 企业版 管理 oop 发行版
原文地址:http://blog.51cto.com/lihuansong/2317021