搜索关键字：sparksql，搜索到306个结果！码迷,mamicode.com！

Spark学习之路（二十）SparkSQL的元数据[转]

概述 SparkSQL 的元数据的状态有两种： 1、in_memory,用完了元数据也就丢了 2、hive , 通过hive去保存的，也就是说，hive的元数据存在哪儿，它的元数据也就存在哪儿。换句话说，SparkSQL的数据仓库在建立在Hive之上实现的。我们要用SparkSQL去构建数据仓库的 ...

分类：数据库时间：2020-01-26 19:19:05 阅读次数：102

Spark学习之路（十八）SparkSQL简单使用[转]

SparkSQL的进化之路 1.0以前： Shark 1.1.x开始： SparkSQL(只是测试性的) SQL 1.3.x: SparkSQL(正式版本)+Dataframe 1.5.x: SparkSQL 钨丝计划 1.6.x： SparkSQL+DataFrame+DataSet(测试版本) ...

分类：数据库时间：2020-01-26 19:06:08 阅读次数：99

【2020/1/24】寒假自学——学习进度报告5

接下来要写4篇的进度报告，准备把RDD编程和SparkSQL放在这几天一起弄掉（没回老家的大年三十稍微有些无聊）。这一篇我想先笼统一下各方面的知识，省的有不理解的地方。首先是RDD。作为一个分布式的数据构造，RDD对我来说方法是抽象的，而且一般来说面向我的都是函数式的编程操作，很难体会到RDD ...

分类：其他好文时间：2020-01-24 20:10:05 阅读次数：101

SparkSQL编程需注意的细节

本文通过精炼的归纳总结和翔实的举例说明列举出SparkSQL开发过程中经常出错的，需要注意的一些细节，欢迎交流~ ...

分类：数据库时间：2020-01-20 14:50:47 阅读次数：81

hello world

1.spark 架构， scala，IDE，compiler，plugin，hadoop，resourcemanager，taskscheduler，line，递归函数，memory，shuffle， dag,stage,taskset, sparksql,rdd,dataframe 二维表格，sq ...

分类：其他好文时间：2020-01-16 14:23:34 阅读次数：118

大数据-spark理论(3)sparkSql，sparkStreaming，spark调优

导读目录第一节：sparksql 1：简介 2：核心 3：与hive整合 4：dataFrame 5：函数第二节：spark Streaming 1：对比strom 2：DStream的算子 3：代码 4：driver HA 5：读取数据第三节：spark调优第一节：sparksql （1） ...

分类：数据库时间：2020-01-09 20:46:58 阅读次数：91

Spark SQL的官网解释

一.官网位置1.位置2.解释官网位置DataSet1.6出现的SchemaRDD<1.31.3版本前叫SchemaRDD1.3以后叫DataFrameDataSet支持Scala,JAVA不支持pythonDataFrame支持四种JAVA,Scala.Python,RDataFrame:并不是sparksql独创的，原来就有的，从其他框架借鉴过来的二.DataFrame注意事项1.注意分布

分类：数据库时间：2020-01-05 09:39:35 阅读次数：76

hivesql 迁移spark3.0 sparksql报错如Cannot safely cast '字段':StringType to IntegerType的问题

一问题 hivesql可以正常运行，spark3.0运行报错如图 spark3.0配置查看源码新增一个 val STORE_ASSIGNMENT_POLICY = buildConf("spark.sql.storeAssignmentPolicy") .doc("When inserting ...

分类：数据库时间：2019-12-25 20:34:49 阅读次数：162

【SparkSQL】介绍、与Hive整合、Spark的th/beeline/jdbc/thriftserve2、shell方式使用SQL

目录一、Spark SQL介绍二、Spark和Hive的整合三、Spark的thriftserve2/beeline/jdbc 四、shell方式使用SQL 一、Spark SQL介绍官网：http://spark.apache.org/sql/ 学习文档：http://spark.apac ...

分类：数据库时间：2019-12-24 23:44:13 阅读次数：353

sparksql 自定义用户函数（UDF）

自定义用户函数有两种方式，区别：是否使用强类型，参考demo：https://github.com/asker124143222/spark-demo 1、不使用强类型，继承UserDefinedAggregateFunction package com.home.spark import org. ...

分类：数据库时间：2019-12-24 19:01:05 阅读次数：134

共306条上一页 1 ... 3 4 5 6 7 ... 31 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)