码迷,mamicode.com
首页 >  
搜索关键字:sparksql hivecontext    ( 324个结果
【大数据】SparkSql连接查询中的谓词下推处理(一)
SparkSql 是架构在 Spark 计算框架之上的分布式 Sql 引擎,使用 DataFrame 和 DataSet 承载结构化和半结构化数据来实现数据复杂查询处理,提供的 DSL可以直接使用 scala 语言完成 Sql 查询,同时也使用? thriftserver 提供服务化的 Sql 查询功能。
分类:数据库   时间:2019-05-17 09:32:42    阅读次数:200
大数据数据仓库-基于大数据体系构建数据仓库(Hive,Flume,Kafka,Azkaban,Oozie,SparkSQL)
大数据数据仓库-基于大数据体系构建数据仓库(Hive,Flume,Kafka,Azkaban,Oozie,SparkSQL) ...
分类:数据库   时间:2019-05-12 13:36:39    阅读次数:163
Spark学习(四)Spark2.3 HA集群的分布式安装
一、下载Spark安装包 1、从官网下载 http://spark.apache.org/downloads.html 2、从微软的镜像站下载 http://mirrors.hust.edu.cn/apache/ 3、从清华的镜像站下载 https://mirrors.tuna.tsinghua.e ...
分类:其他好文   时间:2019-05-07 21:36:24    阅读次数:192
关于自定义sparkSQL数据源(Hbase)操作中遇到的坑
自定义sparkSQL数据源的过程中,需要对sparkSQL表的schema和Hbase表的schema进行整合; 对于spark来说,要想自定义数据源,你就必须得实现这3个接口: 所以,如果对接Hbase的话,就定义一个Hbase的relation case class HBaseRelation ...
分类:数据库   时间:2019-05-02 00:24:42    阅读次数:189
Spark- SparkSQL中 Row.getLong 出现NullPointerException错误的处理方法
在SparkSQL中获取Row的值,而且Row的字段允许null时,在取值的时候取到null赋值给新的变量名会报NullPointerException错误, 可以先用row.isNullAt(index)去判断该字段的值是否为空 首先上错误 修改为先初始化变量,判断row.isNullAt(6) ...
分类:数据库   时间:2019-04-21 09:27:35    阅读次数:208
spark DataFrame的创建几种方式和存储
一。 从Spark2.0以上版本开始,Spark使用全新的SparkSession接口替代Spark1.6中的SQLContext及HiveContext接口来实现其对数据加载、转换、处理等功能。SparkSession实现了SQLContext及HiveContext所有功能。 SparkSess ...
分类:其他好文   时间:2019-04-13 10:40:54    阅读次数:148
SparkSQL
创建 在Spark SQL中SparkSession是创建DataFrame和执行SQL的入口,创建DataFrame有三种方式:通过Spark的数据源进行创建;从一个存在的RDD进行转换;还可以从Hive Table进行查询返回。 读取json文件创建DataFrame 注意:普通临时view是S ...
分类:数据库   时间:2019-04-11 14:33:27    阅读次数:183
关于sparksql中的hint
前言 在Spark中,结构化查询可以通过指定查询提示(hint)来进行优化。 查询提示,即向查询加入注释,告诉查询优化器提供如何优化逻辑计划, 这在查询优化器无法做出最佳决策时十分有用。 Spark SQL支持COALESCE,REPARTITION以及BROADCAST提示。 在分析查询语句时,所 ...
分类:数据库   时间:2019-04-08 13:12:53    阅读次数:484
SparkSQL之UDAF使用
1.创建一个类继承UserDefinedAggregateFunction类。 ...
分类:数据库   时间:2019-04-06 19:15:29    阅读次数:172
SparkSQL之UDF使用
package cn.piesat.testimport org.apache.spark.sql.SparkSessionimport scala.collection.mutable.ArrayBufferobject SparkSQLTest { def main(args: Array[St ...
分类:数据库   时间:2019-04-06 15:27:58    阅读次数:200
324条   上一页 1 ... 8 9 10 11 12 ... 33 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!