码迷,mamicode.com
首页 >  
搜索关键字:catalyst    ( 86个结果
dependency & DF & DataSet & patitioner
dependecy narrow :onetoone prune range wide :shuffle 查看依赖: .dependecies .toDebugString DF catalyst:(sql's query optimizer) reordering operations reduc ...
分类:其他好文   时间:2017-10-06 23:09:00    阅读次数:297
第七篇:Spark SQL 源码分析之Physical Plan 到 RDD的具体实现
/** Spark SQL源码分析系列文章*/ 接上一篇文章Spark SQL Catalyst源码分析之Physical Plan,本文将介绍Physical Plan的toRDD的具体实现细节: 我们都知道一段sql,真正的执行是当你调用它的collect()方法才会执行Spark Job,最后 ...
分类:数据库   时间:2017-09-26 15:00:36    阅读次数:241
第五篇:Spark SQL Catalyst源码分析之Optimizer
/** Spark SQL源码分析系列文章*/ 前几篇文章介绍了Spark SQL的Catalyst的核心运行流程、SqlParser,和Analyzer 以及核心类库TreeNode,本文将详细讲解Spark SQL的Optimizer的优化思想以及Optimizer在Catalyst里的表现方式 ...
分类:数据库   时间:2017-09-26 14:55:25    阅读次数:242
第四篇:Spark SQL Catalyst源码分析之TreeNode Library
/** Spark SQL源码分析系列文章*/ 前几篇文章介绍了Spark SQL的Catalyst的核心运行流程、SqlParser,和Analyzer,本来打算直接写Optimizer的,但是发现忘记介绍TreeNode这个Catalyst的核心概念,介绍这个可以更好的理解Optimizer是如 ...
分类:数据库   时间:2017-09-26 14:53:32    阅读次数:315
第三篇:Spark SQL Catalyst源码分析之Analyzer
/** Spark SQL源码分析系列文章*/ 前面几篇文章讲解了Spark SQL的核心执行流程和Spark SQL的Catalyst框架的Sql Parser是怎样接受用户输入sql,经过解析生成Unresolved Logical Plan的。我们记得Spark SQL的执行流程中另一个核心的 ...
分类:数据库   时间:2017-09-26 14:50:35    阅读次数:195
第六篇:Spark SQL Catalyst源码分析之Physical Plan
/** Spark SQL源码分析系列文章*/ 前面几篇文章主要介绍的是spark sql包里的的spark sql执行流程,以及Catalyst包内的SqlParser,Analyzer和Optimizer,最后要介绍一下Catalyst里最后的一个Plan了,即Physical Plan。物理计 ...
分类:数据库   时间:2017-09-26 14:49:57    阅读次数:256
第八篇:Spark SQL Catalyst源码分析之UDF
/** Spark SQL源码分析系列文章*/ 在SQL的世界里,除了官方提供的常用的处理函数之外,一般都会提供可扩展的对外自定义函数接口,这已经成为一种事实的标准。 在前面Spark SQL源码分析之核心流程一文中,已经介绍了Spark SQL Catalyst Analyzer的作用,其中包含了 ...
分类:数据库   时间:2017-09-26 14:48:24    阅读次数:162
第一篇:Spark SQL源码分析之核心流程
/** Spark SQL源码分析系列文章*/ 自从去年Spark Submit 2013 Michael Armbrust分享了他的Catalyst,到至今1年多了,Spark SQL的贡献者从几人到了几十人,而且发展速度异常迅猛,究其原因,个人认为有以下2点: 1、整合:将SQL类型的查询语言整 ...
分类:数据库   时间:2017-09-26 14:01:24    阅读次数:284
第二篇:Spark SQL Catalyst源码分析之SqlParser
/** Spark SQL源码分析系列文章*/ Spark SQL的核心执行流程我们已经分析完毕,可以参见Spark SQL核心执行流程,下面我们来分析执行流程中各个核心组件的工作职责。 本文先从入口开始分析,即如何解析SQL文本生成逻辑计划的,主要设计的核心组件式SqlParser是一个SQL语言 ...
分类:数据库   时间:2017-09-26 13:59:44    阅读次数:439
Catalyst 3750堆叠
Catalyst 3750系列使用StackWise技术,它是一种创新性的堆叠架构,提供了一个32Gbps的堆叠互联,连接多达9台交换机,并将它们整合为一个统一的、逻辑的、针对融合而优化的设备,从而让客户可以更加放心地部署语音、视频和数据应用, http://thely.blog.51cto.com ...
分类:其他好文   时间:2017-07-20 23:44:14    阅读次数:208
86条   上一页 1 2 3 4 5 6 ... 9 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!