首页 > 其他好文 > 详细

【互动问答分享】第17期决胜云计算大数据时代Spark亚太研究院公益大讲堂

时间：2014-10-17 19:00:33 阅读：178 评论：0 收藏：0 [点我收藏+]

标签：云计算大数据 spark spark技术 spark热点 spark互动问答

“决胜云计算大数据时代”

Spark亚太研究院100期公益大讲堂【第17期互动问答分享】

Q1：为了加快spark shuffle 的执行速度是否可以把spark_local_dirs 指向一块固态硬盘上面，这样做是否有效果。

可以把spark_local_dirs指向一块固态硬盘上面,这样会非常有效的提升Spark执行速度；
同时想更快的提升Spark运行速度的话可以指定多个Shuffle输出的目录，让Shuffle并行读写磁盘；

Q2：solidation=true只是在同一机器上进行合并对吧

solidation=true是在同一台机器上进行合并；
当进行合并的时候会把属于同一个Reducer的bucket放入同一个文件，这回极大的减少Shuffler文件的数量，提升性能；

Q3：未来spark与hadoop会共存吗

Spark和hadoop会共存， Spark+Hadoop= A winning combination；
并存的时候，Hadoop主要使用HDFS进行数据存储，Spark负责对大数据一体化多元化的计算；

本文出自 “Spark亚太研究院” 博客，请务必保留此出处http://rockyspark.blog.51cto.com/2229525/1565214

【互动问答分享】第17期决胜云计算大数据时代Spark亚太研究院公益大讲堂

标签：云计算大数据 spark spark技术 spark热点 spark互动问答

原文地址：http://rockyspark.blog.51cto.com/2229525/1565214

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！