“决胜云计算大数据时代”Spark亚太研究院100期公益大讲堂【第18期互动问答分享】Q1:Master和Driver的是同一个东西吗?两者不是同一个东西,在Standalone模式下Master是用于集群资源管理和调度的,而Driver适用于指挥Worker上的Executor通过多线的方式处理任务的;Master位于..
分类:
其他好文 时间:
2014-10-31 15:58:01
阅读次数:
219
“决胜云计算大数据时代”Spark亚太研究院100期公益大讲堂
【第17期互动问答分享】Q1:为了加快sparkshuffle的执行速度是否可以把spark_local_dirs指向一块固态硬盘上面,这样做是否有效果。可以把spark_local_dirs指向一块固态硬盘上面,这样会非常有效的提升Spark执行速度;同..
分类:
其他好文 时间:
2014-10-17 19:00:33
阅读次数:
178
“决胜云计算大数据时代”Spark亚太研究院100期公益大讲堂【第15期互动问答分享】Q1:AppClient和worker、master之间的关系是什么?:AppClient是在StandAlone模式下SparkContext.runJob的时候在Client机器上应用程序的代表,要完成程序的registerApplication等功能;当程序完成..
分类:
其他好文 时间:
2014-10-08 17:59:06
阅读次数:
166
“决胜云计算大数据时代”Spark亚太研究院100期公益大讲堂【第13期互动问答分享】Q1:tachyon+spark框架现在有很多大公司在使用吧?Yahoo!已经在长期大规模使用;国内也有公司在使用;Q2:impala和sparksql如何选择呢?Impala已经被官方宣布“安乐死”,被官方温柔的放弃;Spark..
分类:
其他好文 时间:
2014-09-24 13:32:07
阅读次数:
244
“决胜云计算大数据时代”Spark亚太研究院100期公益大讲堂
【第12期互动问答分享】Q1:jobserver
企业使用情况如何?中国有一家视频网站已经使用超过JobServer超过半年的时间;2013年和2014年Spark
Summit均大力推荐使用JobServer;Q2:请问,jobserver是适合企业内部还是供外..
分类:
其他好文 时间:
2014-09-19 13:59:36
阅读次数:
186
Q1:docker成熟度如何?Docker是2013年和2014年最火爆的云计算开源项目;Baidu公司是中国使用Docker最为深入和最大规模的公司,线上稳定运行数十万个Docker容器,目前已经使用Docker全面全面升级了自己的BAE,升级后的BAE无论是性能还是业务表现均超出预期;Q2:Docker与云计算..
分类:
其他好文 时间:
2014-09-12 15:27:54
阅读次数:
198
对于90%以上想学习Spark的人而言,如何构建Spark集群是其最大的难点之一,为了解决大家构建Spark集群的一切困难,家林把Spark集群的构建分为了四个步骤,从零起步,不需要任何前置知识,涵盖操作的每一个细节,构建完整的Spark集群。从零起步,构建Spark集群经典四部曲:第一步..
分类:
其他好文 时间:
2014-09-12 15:25:14
阅读次数:
240
第二步:安装每个软件安装Vmware虚拟机点击“VMware-workstation-full-9.0.2-1031769”可执行文件,如下图所示:点击“Next”进入下一步:我们选择“Custom”进入下一步;2.选择所有的功能,如下所示:我们选择“Custom”进入下一步;2.选择所有的功能,如下所示:点击”Next”..
分类:
其他好文 时间:
2014-09-12 15:22:04
阅读次数:
269
决胜云计算大数据时代”Spark亚太研究院100期公益大讲堂【第3期互动问答分享】Q1:groupbykey是排好序的吗?分组排序怎么实现?groupByKey在一个由(K,V)对组成的数据集上调用,返回一个(K,Seq[V])对的数据集,所以是没有排序的;要想分组排序,首先要使用groupByKey完成分..
分类:
其他好文 时间:
2014-09-10 14:19:51
阅读次数:
259