标签:
Spark Contributor,Databricks工程师连城,华为大数据平台开发部部长陈亮,网易杭州研究院副院长汪源,TalkingData首席数据科学家张夏天联袂力荐
1.本书全面、系统地介绍了Spark源码,深入浅出,细致入微
2.提供给读者一系列分析源码的实用技巧,并给出一个合理的阅读顺序
3.始终抓住资源分配、消息传递、容错处理等基本问题,抽丝拨茧
4.一步步寻找答案,所有问题迎刃而解,使读者知其然更知其所以然
与Hadoop、Hive、Storm等老牌大数据系统相比,Spark的代码体积要小得多。然而这样一套精简的系统却同时承载了批处理、流处理、迭
代计算、关系查询、图计算等多种计算范式,再加上Scala和函数式编程并不为普通程序员所熟悉,阅读和分析Spark源码并不是一件特别轻松的事情。本
书记录了一系列分析Spark源码的实用技巧,并给出了一个合理的阅读顺序,相信可以令学习Spark的读者们事半功倍。 --Spark
Contributor,Databricks工程师 连城
介绍Spark的书籍很多,但一般不够全面,而这本书非常系统全面地介绍了Spark源码,深入浅出、细致入微,把Spark的由来、Spark整体
框架、Spark各软件栈、Spark环境搭建、Spark部署模式等从源码角度一步步剖析得非常清楚。作者有很强的系统设计、软件工程功底,读者不仅可
以从书中学到Spark知识,还可以学习到作者对新技术研究、源码研究很多好的方法和技巧。授人以鱼不如授人以渔,对在校大学生、Spark初学者、大数
据开发工程师来说,这本书非常值得拥有。 --华为大数据平台开发部部长 陈亮
难以置信,薄薄的一本书可以兼具如此的广度与深度。除了Spark核心系统,本书还介绍了Streaming、SQL、GraphX、MLLib等扩
展库,内容相当全面。但更"赞"的是本书对Spark及各扩展库的运行机理,无不提纲挈领,一一阐明,让读者不但知其然,还能知其所以然。如果想在生产环
境中用好Spark,本书值得细读。
--网易杭州研究院副院长 汪源
Spark目前正在蓬勃发展,越来越多的公司把大数据计算任务迁移到Spark平台上来。Spark开发的学习曲线并不陡峭。但是处理大数据,需要的
不仅是逻辑正确的程序,还需要高性能的程序。如果想把Spark的性能挖掘到极致,那就需要深入了解Spark的设计思想和运行机制,而要了解这些,没有
比读源代码更直接的了。许鹏老师的这本书,对于那些没有时间、精力直接啃源代码或者对Scala语言还不太精通的读者来说是一个福音。
--TalkingData首席数据科学家 张夏天
标签:
原文地址:http://www.cnblogs.com/x113/p/4368603.html