前面介绍了sparkSQL的运行架构,后面将介绍sparkSQL的使用。在介绍sparkSQL的使用之前,我们需要搭建一个sparkSQL的测试环境。本次测试环境涉及到hadoop之HDFS、hive、spark以及相关的数据文件,相关的信息如下:
hadoop版本为2.2.0hive版本为0.13spark版本为1.1.0-rc3MySQL版本为5.6.12测试数据下载地点:http:...
分类:
数据库 时间:
2014-09-10 09:39:40
阅读次数:
378
sparkSQL1.1对数据的查询分成了2个分支:sqlContext 和 hiveContext。
在sqlContext中,sparkSQL可以使用SQL-92语法对定义的表进行查询,表的源数据可以来自:
RDDparquet文件json文件
在hiveContext中,sparkSQL可以使用HQL语法,对hive数据进行查询,sparkSQ...
分类:
数据库 时间:
2014-09-10 09:38:00
阅读次数:
406
Today I attended a meeting of reviewing code, and I learned a lot from it. In the discuss, we found out a problem that our program didn't have a good ...
分类:
其他好文 时间:
2014-09-09 22:49:59
阅读次数:
220
安装SparkMaster、Slave1、Slave2这三台机器上均需要安装Spark。首先在Master上安装Spark,具体步骤如下:第一步:把Master上的Spark解压:我们直接解压到当前目录下:此时,我们创建Spark的目录“/usr/local/spark”:把解压后的“spark-1...
分类:
其他好文 时间:
2014-09-09 15:36:49
阅读次数:
137
安装Spark ? Master、Slave1、Slave2这三台机器上均需要安装Spark。 首先在Master上安装Spark,具体步骤如下: 第一步:把Master上的Spark解压: 我们直接解压到当前目录下: 此时,我们创建Spark的目录“/usr/...
分类:
其他好文 时间:
2014-09-09 13:52:59
阅读次数:
167
主要包含使用maven和sbt编译spark源码。还有配置idea等。...
分类:
其他好文 时间:
2014-09-07 01:07:54
阅读次数:
202
本文简要介绍如何使用spark-cassandra-connector将json文件导入到cassandra数据库,这是一个使用spark的综合性示例。
分类:
Web程序 时间:
2014-09-06 15:59:03
阅读次数:
276
需要的软件包:Spark1.0.2Scala2.10.4一、安装ScalaRpm–ivhscala-2.10.4.rpm#安装scalaScala–version#检查刚刚安装的scala版本Scalacoderunnerversion2.10.4--Copyright2002-2013,LAMP/EPFL[hadoop@hadoop2~]$scala#进入scala命令行交互模式做简单运算看下运行结果:至此,sc..
分类:
其他好文 时间:
2014-09-05 16:29:12
阅读次数:
199
“决胜云计算大数据时代”Spark亚太研究院100期公益大讲堂 【第10期互动问答分享】Q1:Spark on Yarn的运行方式是什么?Spark on Yarn的运行方式有两种:Client和Cluster模 Client模式如下所示: ...
分类:
其他好文 时间:
2014-09-05 14:15:31
阅读次数:
177
背景
前段时间在为内部自研的计算框架设计算子层,参考对比了一些开源的计算框架的算子层,本文做一个粗粒度的梳理。
下面这张图是我对计算框架抽象层次的一个拆分,具体可以参考上周日杭州Spark meetup上我做的Spark SQL分享 slides。...
分类:
其他好文 时间:
2014-09-05 10:07:32
阅读次数:
157