搜索关键字：Spark BDAS，搜索到7003个结果！码迷,mamicode.com！

Spark分析之Job Scheduling Process

经过前面文章的SparkContext、DAGScheduler、TaskScheduler分析，再从总体上了解Spark Job的调度流程1、SparkContext将job的RDD DAG图提交给DAGScheduler；2、DAGScheduler将job分解成Stage DAG，将每个Sta...

分类：其他好文时间：2014-08-02 04:07:42 阅读次数：1266

VMware 克隆虚拟机或加载新的已安装虚拟机时System eth0不能使用的解决方法

近年来的大数据应用特别热，特别是Hadoop和Spark。但大家使用这些分布式文件系统和计算框架都需要一个分布式的集群环境，而大家手头一般没有多余的机器部署master和多个slave节点，就只能在VMware上多安装几个虚拟机来模拟集群的搭建，但是安装好一台虚拟机后，我想大部分的人都不想再耗时再重...

分类：其他好文时间：2014-08-02 01:49:52 阅读次数：267

Spark数据本地性

1、文件系统本地性第一次运行时数据不在内存中，需要从HDFS上取，任务最好运行在数据所在的节点上；2、内存本地性第二次运行，数据已经在内存中，所有任务最好运行在该数据所在内存的节点上；3、LRU置换如果数据只缓存在内存中而并没有缓存到磁盘上，此时数据被置换出内存，则从HDFS上读取； ...

分类：其他好文时间：2014-08-02 01:47:22 阅读次数：218

Spark运行架构

1、构建Spark Application运行环境；在Driver Program中新建SparkContext（包含sparkcontext的程序称为Driver Program）；Spark Application运行的表现方式为：在集群上运行着一组独立的executor进程，这些进程由spar...

分类：其他好文时间：2014-08-02 01:34:22 阅读次数：292

GraphX笔记

val graph=GraphLoader.edgeListFile(sc,"/home/spark/spark/graphx/data/followers.txt")//加载边时顶点是边上出现的点,定点默认数据是1 val users = sc.textFile("/home/spark/spark/graphx/data/users.txt").map { line=> val field...

分类：其他好文时间：2014-08-01 23:17:12 阅读次数：323

Spark教程-构建Spark集群（2）

第二步：安装每个软件安装Vmware虚拟机点击“VMware-workstation-full-9.0.2-1031769”可执行文件，如下图所示：点击“Next”进入下一步：我们选择“Custom”进入下一步；2.选择所有的功能，如下所示：点击”Next”进入如下图所示界面： ...

分类：其他好文时间：2014-08-01 15:56:51 阅读次数：243

pyspark原理简介

这是前段时间在看spark的python支持的时候，简单过了一下pyspark里的python代码，整理了一个大致流程。虽然几乎不会python，但基本上能看懂pyspark是怎么让不同虚拟机之间传输数据的、如何在python环境调用java类的、pyspark SDK的丰富程度取决于什么、需要做些什么流程和封装等。我看了下，应该只有Pyspark Internals这篇wiki里介绍了pyspark的实现机制，大体是下面这张图就可以表示...

分类：其他好文时间：2014-07-31 00:01:36 阅读次数：515

Spark SQL Catalyst源码分析之Physical Plan 到 RDD的具体实现

Spark SQL 物理计划到 RDD 的计算过程实现。...

分类：数据库时间：2014-07-29 22:08:02 阅读次数：656

Spark SQL Catalyst源码分析之Physical Plan

Spark SQL之Catalyst的物理计划，讲解了物理计划的产生过程，以及涉及到的策略。...

分类：数据库时间：2014-07-29 14:46:18 阅读次数：514

3 分钟快速体验 Apache Spark SQL

“War of the Hadoop SQL engines. And the winner is …?” 这是个很好的问题。不过，无论答案如何，我们都值得花一点时间了解一下 Spark SQL 这个 Spark 家族里面的成员。...

分类：数据库时间：2014-07-29 14:35:08 阅读次数：308

共7003条上一页 1 ... 681 682 683 684 685 ... 701 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)