搜索关键字：sparksql，搜索到306个结果！码迷,mamicode.com！

SparkSQL读写JDBC

1.向JDBC读数据 object SparkSQL02_Datasource { def main(args: Array[String]): Unit = { //创建上下文环境配置对象 val conf: SparkConf = new SparkConf().setMaster("local ...

分类：数据库时间：2021-05-24 05:59:48 阅读次数：0

大数据总结

学习过得技术 HDFS YARN MR HIVE HBASE SPARK SPARK(sparkCore、sparkSql、sparkStreaming) HDFS 数据库管理、存磁盘 Ha模式(在zookeeper之上) 联邦机制(把大象装进冰箱) split切片 Hbase 列式数据库半结构 ...

分类：其他好文时间：2021-04-05 12:37:34 阅读次数：0

Spark07-SparkSQL

在介绍 Spark SQL之前，我们先了解两种基本的数据分析方式。一、数据分析的两种方式数据分析的方式大致上可以划分为 SQL 和命令式两种。命令式在前面的 RDD部分,非常明显可以感觉的到是命令式的,主要特征是通过一个算子,可以得到一个结果,通过结果再进行后续计算。例如： sc.para ...

分类：数据库时间：2021-02-16 12:29:50 阅读次数：0

Spark学习--Structured Streaming

Structured Streaming Structured Streaming 是 Spark Streaming 的进化版 Spark 编程模型的进化过程总结 RDD 的优点面向对象的操作方式可以处理任何类型的数据 RDD 的缺点运行速度比较慢, 执行过程没有优化 API 比较僵硬, ...

分类：其他好文时间：2021-01-18 11:40:47 阅读次数：0

Spark学习之SparkSQL

##SparkSQL 是什么 ##SparkSQL 初体验 ##Catalyst 优化器 ##Dataset 的特点 ##DataFrame 的作用和常见操作 ##Dataset 和 DataFrame 的异同 ...

分类：数据库时间：2021-01-18 11:03:21 阅读次数：0

Spark开发_Spark的UDF开发

###Spark中的UDF Spark1.6只能创建临时UDF，不支持创建持久化的UDF。从Spark-2.0开始，SparkSQL支持持久化的UDF，目前看来是支持UDAF ###Spark中的UDF 过程 (1)自定义UDF类，实现UDF1/2/3....22中的接口之一，其中UDF后跟的数字 ...

分类：其他好文时间：2020-11-26 15:06:55 阅读次数：6

Spark(十一)【SparkSQL的基本使用】

一. SparkSQL简介 Spark SQL是Spark用于结构化数据(structured data)处理的Spark模块。 Dremel > Drill(Apache) >Impala(Cloudrea) Presto(Hotonworks) Hive > Shark(对Hive的模仿，区别在 ...

分类：数据库时间：2020-08-07 21:45:52 阅读次数：79

多种开源OLAP引擎测评报告

开源OLAP引擎测评报告(SparkSql、Presto、Impala、HAWQ、ClickHouse、GreenPlum) https://blog.csdn.net/oDaiLiDong/article/details/86570211 ...

分类：其他好文时间：2020-07-27 13:42:55 阅读次数：81

推荐系统大规模特征工程与FEDB的Spark基于LLVM优化

今天给大家分享第四范式在推荐系统大规模特征工程与Spark基于LLVM优化方面的实践，主要包括以下四个主题。大规模推荐系统特征工程介绍SparkSQL与FESQL架构设计基于LLVM的Spark性能优化推荐系统与Spark优化总结大规模推荐系统特征工程介绍推荐系统在新闻推荐、搜索引擎、广告投放以及最新很火的短视频App中都有非常广阔的应用，可以说绝大部分互联网企业和传统企业都可以通过推荐系统来提升

分类：数据库时间：2020-07-14 09:27:20 阅读次数：72

半小时，利用FEDB将你的Spark SQL模型变为在线服务

SparkSQL在机器学习场景中应用第四范式已经在很多行业落地了上万个AI应用，比如在金融行业的反欺诈，媒体行业的新闻推荐，能源行业管道检测，而SparkSQL在这些AI应用中快速实现特征变换发挥着重要的作用SparkSQL在特征变换主要有一下几类1.多表场景，用于表之间拼接操作，比如交易信息表去拼接账户表2.使用udf进行简单的特征变换，比如对时间戳进行hour函数处理3.使用时间窗口和udaf

分类：数据库时间：2020-07-09 17:54:20 阅读次数：99

共306条 1 2 3 4 ... 31 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)