搜索关键字：spark shuffle，搜索到7773个结果！码迷,mamicode.com！

“War of the Hadoop SQL engines. And the winner is …?” 这是个很好的问题。不过，无论答案如何，我们都值得花一点时间了解一下 Spark SQL 这个 Spark 家族里面的成员。...

分类：数据库时间：2014-07-29 14:35:08 阅读次数：308

首先要推荐一下：http://www.alidata.org/archives/1470阿里的大牛在上面的文章中比较详细的介绍了shuffle过程中mapper和reduce的每个过程，强烈推荐先读一下。不过，上文没有写明一些实现的细节，比如：spill的过程，mapper生成文件的 partiti...

分类：其他好文时间：2014-07-29 13:43:18 阅读次数：298

MapReduce:详解Shuffle过程

Shuffle过程是MapReduce的核心，也被称为奇迹发生的地方。要想理解 MapReduce， Shuffle是必须要了解的。我看过很多相关的资料，但每次看完都云里雾里的绕着，很难理清大致的逻辑，反而越搅越混。前段时间在做MapReduce job 性能调优的工作，需要深入代码研究MapRed...

分类：其他好文时间：2014-07-29 13:38:48 阅读次数：219

Spark SQL 源码分析系列文章

Spark SQL 源码分析系列文章，从整个SQL执行流程到各个环节的关键组件，以及Catalyst框架的讲解。...

分类：数据库时间：2014-07-29 13:10:36 阅读次数：328

Scala 机器学习库

自然语言处理 ScalaNLP—机器学习和数值计算库的套装 Breeze —Scala用的数值处理库 Chalk—自然语言处理库。 FACTORIE—可部署的概率建模工具包，用Scala实现的软件库。为用户提供简洁的语言来创建关系因素图，评估参数并进行推断。数据分析/数据可视化 MLlib in Apache Spark—Spark下的分布式机器学...

分类：其他好文时间：2014-07-29 13:01:37 阅读次数：372

【互动问答分享】第5期决胜云计算大数据时代Spark亚太研究院公益大讲堂

spark互动问答

分类：其他好文时间：2014-07-28 23:35:14 阅读次数：336

Spark Web界面

1.7 Spark Web 界面每一个SparkContext发布一个web界面，默认端口是4040，它显示了应用程序的有用信息。这包括： Ø 一系列的调度阶段和任务 Ø 对于RDD大小和内存使用的总结 Ø 环境信息 Ø 运行的执行器（executor）的信息你可以通过浏览器访问http://:4040，当然，你必去先启动SparkContext。比如命令：./bin/sp...

分类：Web程序时间：2014-07-28 16:35:43 阅读次数：1584

3 分钟学会调用 Apache Spark MLlib KMeans

Apache Spark MLlib是Apache Spark体系中重要的一块拼图：提供了机器学习的模块。不过，目前对此网上介绍的文章不是很多。拿KMeans来说，网上有些文章提供了一些示例程序，而这些程序基本和Apache Spark 官网上的程序片断类似：在得到训练模型后，几乎都没有展示如何使用该模型、程序执行流程、结果展示以及举例测试数据等部分。笔者根据Apache Spark官网上的程序片断，写了一个完整的调用MLlib KMeans库的测试程序，并成功在Spark 1.0 + Yarn 2.2 的...

分类：其他好文时间：2014-07-28 00:01:39 阅读次数：343

Spark SQL Catalyst源码分析之Optimizer

Spark SQL 中Catalyst的核心优化器Optimizer源码剖析...

分类：数据库时间：2014-07-26 02:17:36 阅读次数：390

Linux环境下安装Tigase XMPP Server

Tigase是一种XMPP服务器，可以作为采用XMPP协议的各种IM(Instant Messeging)工具（如Pandion、Spark等）的服务器。在Linux环境下安装Tigase的步骤如下：(1)下载安装文件到https://projects.tigase.org/projects/tig...

分类：系统相关时间：2014-07-25 18:58:52 阅读次数：733

共7773条上一页 1 ... 757 758 759 760 761 ... 778 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)