码迷,mamicode.com
首页 >  
搜索关键字:sqlcontext    ( 63个结果
Spark(九) -- SparkSQL API编程
Text文本文件测试一个简单的person.txt文件内容为:JChubby,13 Looky,14 LL,15 分别是Name和Age在Idea中新建Object,原始代码如下:object TextFile{ def main(args:Array[String]){ } }SparkSQL编程模型:第一步: 需要一个SQLContext对象,该对象是SparkSQL操作的入口...
分类:数据库   时间:2015-05-25 10:03:28    阅读次数:216
spark sql中进行sechema合并
spark sql中支持sechema合并的操作。直接上官方的代码吧。val sqlContext = new org.apache.spark.sql.SQLContext(sc)// sqlContext from the previous example is used in this exa...
分类:数据库   时间:2015-05-18 16:35:11    阅读次数:294
spark sql中将数据保存成parquet,json格式
val df = sqlContext.load("/opt/modules/spark1.3.1/examples/src/main/resources/people.json","json")df.select("name","age").save("/opt/test/namesAndAges...
分类:数据库   时间:2015-05-18 16:07:42    阅读次数:355
Saprk-DataFrame认识
使用spark 1.3.1scala> import sqlContext.createSchemaRdd结果报错::29: error: value createSchemaRdd is not a member of org.apache.spark.sql.SQLContext i...
分类:其他好文   时间:2015-05-15 17:26:14    阅读次数:158
Spark SQL1.2 和Spark SQL1.3的测试
Spark1.21. 文本导入创建RDD的形式,测试txt文本master=spark://master:7077./bin/spark-shellscala> val sqlContext = new org.apache.spark.sql.SQLContext(sc) sqlContext:....
分类:数据库   时间:2015-05-05 23:46:31    阅读次数:226
SparkSQL 初步应用
最近项目中使用SparkSQL来做数据的统计分析,闲来就记录下来。 直接上代码: importorg.apache.spark.SparkContext importorg.apache.spark.sql.SQLContext objectSparkSQL{ //定义两个caseclassA和B: //A是用户的基本信息:包括客户号、***号和性别 //B是用户的交易信息..
分类:数据库   时间:2015-04-15 15:00:49    阅读次数:565
spark SQL编程动手实战-01
首先创建SparkContext上下文: 接着引入隐身转换,用于把RDD转成SchemaRDD: 接下来定义一个case class 来用于描述和存储SQL表中的每一行数据: 接下来要加载数据,这里的测试数据是user.txt文件: 我们创建好use.txt增加内容并上传到hdfs中: web控制台查询: hdfs命令查询: 加...
分类:数据库   时间:2015-03-02 19:08:17    阅读次数:222
SparkSQL简易入门
SparkSQL操作文本文件val sqlContext = new org.apache.spark.sql.SQLContext(sc)import sqlContext._case class PageViews(track_time: String, url: String, session...
分类:数据库   时间:2015-01-09 10:29:50    阅读次数:732
sparkSQL1.1入门之三:sparkSQL组件之解析
上篇在总体上介绍了sparkSQL的运行架构及其基本实现方法(Tree和Rule的配合),也大致介绍了sparkSQL中涉及到的各个概念和组件。本篇将详细地介绍一下关键的一些概念和组件,由于hiveContext继承自sqlContext,关键的概念和组件类似,只不过后者针对hive的特性做了一些修正和重写,所以本篇就只介绍sqlContext的关键的概念和组件。 概念: Logi...
分类:数据库   时间:2014-10-27 12:53:06    阅读次数:616
sparkSQL1.1入门之十:总结
回顾一下,在前面几章中,就sparkSQL1.1.0基本概念、运行架构、基本操作和实用工具做了基本介绍。 基本概念: SchemaRDD RuleTreeLogicPlanParserAnalyzerOptimizerSparkPlan 运行架构: sqlContext运行架构hiveContext运行架构 基本操作 原生RDD的操作parquet文件的操作j...
分类:数据库   时间:2014-10-23 12:29:53    阅读次数:298
63条   上一页 1 ... 4 5 6 7 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!