码迷,mamicode.com
首页 >  
搜索关键字:sparksql hivecontext    ( 324个结果
sparkSQL1.1入门之一:为什么sparkSQL
2014年9月11日,Spark1.1.0忽然之间发布。笔者立即下载、编译、部署了Spark1.1.0。关于Spark1.1的编译和部署,请参看笔者博客Spark1.1.0 源码编译和部署包生成 。       Spark1.1.0中变化较大是sparkSQL和MLlib,sparkSQL1.1.0主要的变动有: 增加了JDBC/ODBC Server(ThriftServer),...
分类:数据库   时间:2014-09-15 10:05:48    阅读次数:306
SparkSQL使用之如何使用UDF
使用java开发一个helloworld级别UDF,打包成udf.jar,存放在/home/hadoop/lib下,代码如下:package com.luogankun.udf;import org.apache.hadoop.hive.ql.exec.UDF;public class HelloU...
分类:数据库   时间:2014-09-13 19:57:35    阅读次数:401
SparkSQL使用之JDBC代码访问Thrift JDBC Server
启动ThriftJDBCServer:cd $SPARK_HOME/sbinstart-thriftserver.sh &使用jdbc访问ThriftJDBCServer代码段:package com.luogankun.spark.sqlimport java.sql.DriverManageri...
分类:数据库   时间:2014-09-13 18:42:05    阅读次数:497
SparkSQL使用之Thrift JDBC server
Thrift JDBC Server描述Thrift JDBC Server使用的是HIVE0.12的HiveServer2实现。能够使用Spark或者hive0.12版本的beeline脚本与JDBC Server进行交互使用。Thrift JDBC Server默认监听端口是10000。使用Th...
分类:数据库   时间:2014-09-13 18:30:55    阅读次数:468
SparkSQL使用之Spark SQL CLI
Spark SQL CLI的引入使得在SparkSQL中通过hive metastore就可以直接对hive进行查询更加方便;当前版本中还不能使用Spark SQL CLI与ThriftServer进行交互。注意:在使用Spark SQL CLI时需要将hive-site.xml配置文件拷贝到$SP...
分类:数据库   时间:2014-09-13 17:10:25    阅读次数:512
spark1.1的部署、sparksql CLI、sparksql-jdbc运用
SparkSql实际运用:在spark0.9.x中不支持jdbc操作,spark1.1会加入jdbc支持 版本说明:spark-1.1.0+scala-2.10.4+hive-0.12.0 spark1.1的发布正式版:2014/9/11 1、增加start-thriftserver.sh 服务启动,通过jdbc/odbc直接连接 bin/start-thriftser...
分类:数据库   时间:2014-09-13 09:25:24    阅读次数:329
sparkSQL1.1入门之八:sparkSQL之综合应用
Spark之所以万人瞩目,除了内存计算,还有其ALL-IN-ONE的特性,实现了One stack rule them all。下面简单模拟了几个综合应用场景,不仅使用了sparkSQL,还使用了其他Spark组件: 店铺分类,根据销售额对店铺分类货品调拨,根据货品的销售数量和店铺之间的距离进行货品调拨       前者将使用sparkSQL+MLlib的聚类算法,后者将使用s...
分类:数据库   时间:2014-09-11 09:39:41    阅读次数:292
sparkSQL1.1入门之五:测试环境之搭建
前面介绍了sparkSQL的运行架构,后面将介绍sparkSQL的使用。在介绍sparkSQL的使用之前,我们需要搭建一个sparkSQL的测试环境。本次测试环境涉及到hadoop之HDFS、hive、spark以及相关的数据文件,相关的信息如下: hadoop版本为2.2.0hive版本为0.13spark版本为1.1.0-rc3MySQL版本为5.6.12测试数据下载地点:http:...
分类:数据库   时间:2014-09-10 09:39:40    阅读次数:378
sparkSQL1.1入门之六:sparkSQL之基础应用
sparkSQL1.1对数据的查询分成了2个分支:sqlContext 和 hiveContext。       在sqlContext中,sparkSQL可以使用SQL-92语法对定义的表进行查询,表的源数据可以来自: RDDparquet文件json文件       在hiveContext中,sparkSQL可以使用HQL语法,对hive数据进行查询,sparkSQ...
分类:数据库   时间:2014-09-10 09:38:00    阅读次数:406
sparkSQL1.1入门之七:ThriftServer和CLI
spark1.1相较于spark1.0,最大的差别就在于spark1.1增加了万人期待的CLI和ThriftServer。使得hive用户还有用惯了命令行的RDBMS数据库管理员很容易地上手sparkSQL,在真正意义上进入了SQL时代。下面先简单介绍其使用,限于时间关系,以后再附上源码分析。 1:ThriftServer和CLI的命令参数 A:令人惊讶的CLI...
分类:数据库   时间:2014-09-09 12:39:38    阅读次数:387
324条   上一页 1 ... 30 31 32 33 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!