搜索关键字：spark streaming事务处理，搜索到7001个结果！码迷,mamicode.com！

Spark0.9 安装

1、下载Scala wget http://www.scala-lang.org/files/archive/scala-2.10.3.tgz tar xvzf scala-2.10.3.tgz -C /usr/local 2、下载Spark wget http://www.apache.org/dist/incubator/spark/spark-0.9.0-inc...

分类：其他好文时间：2014-05-11 02:06:21 阅读次数：368

Pig系统分析(6)-从Physical Plan到MR Plan再到Hadoop Job

从Physical plan到Map-Reduce Plan 注：因为我们重点关注的是Pig On Spark针对RDD的执行计划，所以Pig物理执行计划之后的后端参考意义不大，这些部分主要分析流程，忽略实现细节。入口类MRCompiler，MRCompilier按照拓扑顺序遍历物理执行计划中的节点，将其转换为MROperator，每个MROperator都代表一个map-reduce j...

分类：其他好文时间：2014-05-10 08:46:07 阅读次数：366

spark shuffle过程分析

spark shuffle流程分析回到ShuffleMapTask.runTask函数现在回到ShuffleMapTask.runTask函数中： overridedef runTask(context:TaskContext): MapStatus = { 首先得到要reduce的task的个数。 valnumOutputSplits= dep.partitioner.num...

分类：其他好文时间：2014-05-09 22:58:33 阅读次数：574

Apache Spark源码走读之6 -- 存储子系统分析

Spark计算速度远胜于Hadoop的原因之一就在于中间结果是缓存在内存而不是直接写入到disk，本文尝试分析Spark中存储子系统的构成，并以数据写入和数据读取为例，讲述清楚存储子系统中各部件的交互关系。

分类：其他好文时间：2014-05-09 05:14:32 阅读次数：405

在eclipse中配置spark 0.9.1源码的开发环境

一、准备工作： 1、下载release版spark 0.9.1，本次用的版本是spark-0.9.1-bin-cdh4。 2、下载scala IDE 3.0.2，这个版本ide的支持scala 2.10版。二、配置工作 1、在ide中新建scala项目，注意jre要用jdk1.7版的。如下图： 2...

分类：系统相关时间：2014-05-09 03:27:34 阅读次数：512

Flex4 Halo组件 List 和 DataGrid

Flex1 到 Flex3 使用的都是 Halo组件，这里将介绍Halo 组件中的List 和 DataGrid 。其中 DataGrid 是显示多列数据中最常用的方式。但是在Spark中还有没对应DataGrid的组件。先写个“食物”的模型 Dinner.as 。 package model { [Bindable] public class Dinner { public...

分类：其他好文时间：2014-05-09 02:34:26 阅读次数：306

Spork: Pig on Spark实现分析

介绍 Spork是Pig on Spark的highly experimental版本，依赖的版本也比较久，如之前文章里所说，目前我把Spork维护在自己的github上：flare-spork。本文分析的是Spork的实现方式和具体内容。 Spark Launcher 在hadoop executionengine包路径下，写了一个Spark启动器，同MapReduceLauncher类似，会在launchPig的时候，把传入的物理执行计划进行翻译。 MR启动器翻译的是MR的操作，以及进一步的MR...

分类：其他好文时间：2014-05-09 02:08:17 阅读次数：358

Task的执行过程分析

Task的执行过程分析 Task的执行通过Worker启动时生成的Executor实例进行， caseRegisteredExecutor(sparkProperties)=> logInfo("Successfullyregistered with driver") //Make this host instead of hostPort ? executor= newExecuto...

分类：其他好文时间：2014-05-08 16:01:31 阅读次数：667

Pig源码分析: 简析执行计划的生成

本文通过跟代码的方式，分析从输入一批Pig-latin到输出物理执行计划（与launcher引擎有关，一般是MR执行计划，也可以是Spark RDD的执行算子）的整体流程。不会具体涉及AST如何解析、如何使用了Anltr、逻辑执行计划如何映射、逻辑执行计划如何优化、MR执行计划如何切分为MR Job，而是从输入一批Pig DSL到待执行的真正执行计划的关键变化步骤（方法和类）。...

分类：其他好文时间：2014-05-08 04:00:42 阅读次数：407

Pig系统分析(8)-Pig可扩展性

本文是Pig系统分析系列中的最后一篇了，主要讨论如何扩展Pig功能，不仅介绍Pig本身提供的UDFs扩展机制，还从架构上探讨Pig扩展可能性。补充说明：前两天同事发现twitter推动的Pig On Spark项目：Spork，准备研究下。 UDFs 通过UDFs（用户自定义函数），可以自定义数据处理方法，扩展Pig功能。实际上，UDFS除了使用之前需要register/define外，和...

分类：其他好文时间：2014-05-07 05:10:44 阅读次数：567

共7001条上一页 1 ... 697 698 699 700 701 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)