码迷,mamicode.com
首页 >  
搜索关键字:spark shuffle    ( 7773个结果
3 分钟快速体验 Apache Spark SQL
“War of the Hadoop SQL engines. And the winner is …?” 这是个很好的问题。不过,无论答案如何,我们都值得花一点时间了解一下 Spark SQL 这个 Spark 家族里面的成员。...
分类:数据库   时间:2014-07-29 14:35:08    阅读次数:308
hadoop核心逻辑shuffle代码分析-map端
首先要推荐一下:http://www.alidata.org/archives/1470阿里的大牛在上面的文章中比较详细的介绍了shuffle过程中mapper和reduce的每个过程,强烈推荐先读一下。不过,上文没有写明一些实现的细节,比如:spill的过程,mapper生成文件的 partiti...
分类:其他好文   时间:2014-07-29 13:43:18    阅读次数:298
MapReduce:详解Shuffle过程
Shuffle过程是MapReduce的核心,也被称为奇迹发生的地方。要想理解 MapReduce, Shuffle是必须要了解的。我看过很多相关的资料,但每次看完都云里雾里的绕着,很难理清大致的逻辑,反而越搅越混。前段时间在做MapReduce job 性能调优的工作,需要深入代码研究MapRed...
分类:其他好文   时间:2014-07-29 13:38:48    阅读次数:219
Spark SQL 源码分析系列文章
Spark SQL 源码分析系列文章,从整个SQL执行流程到各个环节的关键组件,以及Catalyst框架的讲解。...
分类:数据库   时间:2014-07-29 13:10:36    阅读次数:328
Scala 机器学习库
自然语言处理 ScalaNLP—机器学习和数值计算库的套装 Breeze —Scala用的数值处理库 Chalk—自然语言处理库。 FACTORIE—可部署的概率建模工具包,用Scala实现的软件库。为用户提供简洁的语言来创建关系因素图,评估参数并进行推断。 数据分析/数据可视化 MLlib in Apache Spark—Spark下的分布式机器学...
分类:其他好文   时间:2014-07-29 13:01:37    阅读次数:372
【互动问答分享】第5期决胜云计算大数据时代Spark亚太研究院公益大讲堂
spark互动问答
分类:其他好文   时间:2014-07-28 23:35:14    阅读次数:336
Spark Web界面
1.7 Spark Web 界面 每一个SparkContext发布一个web界面,默认端口是4040,它显示了应用程序的有用信息。这包括: Ø  一系列的调度阶段和任务 Ø  对于RDD大小和内存使用的总结 Ø  环境信息 Ø  运行的执行器(executor)的信息 你可以通过浏览器访问http://:4040,当然,你必去先启动SparkContext。比如命令:./bin/sp...
分类:Web程序   时间:2014-07-28 16:35:43    阅读次数:1584
3 分钟学会调用 Apache Spark MLlib KMeans
Apache Spark MLlib是Apache Spark体系中重要的一块拼图:提供了机器学习的模块。不过,目前对此网上介绍的文章不是很多。拿KMeans来说,网上有些文章提供了一些示例程序,而这些程序基本和Apache Spark 官网上的程序片断类似:在得到训练模型后,几乎都没有展示如何使用该模型、程序执行流程、结果展示以及举例测试数据等部分。笔者根据Apache Spark官网上的程序片断,写了一个完整的调用MLlib KMeans库的测试程序,并成功在Spark 1.0 + Yarn 2.2 的...
分类:其他好文   时间:2014-07-28 00:01:39    阅读次数:343
Spark SQL Catalyst源码分析之Optimizer
Spark SQL 中Catalyst的核心优化器Optimizer源码剖析...
分类:数据库   时间:2014-07-26 02:17:36    阅读次数:390
Linux环境下安装Tigase XMPP Server
Tigase是一种XMPP服务器,可以作为采用XMPP协议的各种IM(Instant Messeging)工具(如Pandion、Spark等)的服务器。在Linux环境下安装Tigase的步骤如下:(1)下载安装文件到https://projects.tigase.org/projects/tig...
分类:系统相关   时间:2014-07-25 18:58:52    阅读次数:733
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!