搜索关键字：sparksql，搜索到306个结果！码迷,mamicode.com！

Scala构建元数据

反射方式构建元数据: 通过反射来获取RDD中的Schema信息。这种方式适合于列名(元数据)已知的情况下步骤: 1.SparkConf配置环境 2.SparkContext初始化上下文 3.SQLContext初始化SparkSQL上下文 4.创建一个普通的RDD(sc.textFile) 5.使 ...

分类：其他好文时间：2018-11-24 14:21:32 阅读次数：210

瞄一眼，带你走进SparkSQL的世界

欢迎访问网易云社区，了解更多网易技术产品运营经验。最近想来，大数据相关技术与传统型数据库技术很多都是相互融合、互相借鉴的。传统型数据库强势在于其久经考验的SQL优化器经验，弱势在于分布式领域的高可用性、容错性、扩展性等，假以时日，让其经过一定的改造，比如引入Paxos、raft等，强化自己在分布式 ...

分类：数据库时间：2018-11-21 15:36:51 阅读次数：212

Spark SQL join的三种实现方式

引言 join是SQL中的常用操作，良好的表结构能够将数据分散到不同的表中，使其符合某种规范(mysql三大范式)，可以最大程度的减少数据冗余，更新容错等，而建立表和表之间关系的最佳方式就是join操作。对于Spark来说有3种Join的实现，每种Join对应的不同的应用场景(SparkSQL自动 ...

分类：数据库时间：2018-11-05 20:56:05 阅读次数：1389

ide-dtwave指南（数栖平台）

hive建表字段的时间格式建议使用timestamp或string，date类型会出现异常，比如load文件时时间会变为null sparksql才支持load数据到hive表中，hive2竟然不支持？补数据有自依赖，多天时可以等前一天运行完再运行后一天，但是补下游不行，会导致多天并行，原因是补下 ...

分类：其他好文时间：2018-11-02 13:01:42 阅读次数：1315

Hive安装与简单使用并集成SparkSQL

## Hive环境搭建1. hive下载：http://archive-primary.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gzwget http://archive-primary.cloudera.com/cdh5/cdh/5/hive ...

分类：数据库时间：2018-10-31 11:22:40 阅读次数：179

sparkSQL flinkSQL hiveSQL性能对比

最近在研究flink，发现较新版的flink支持sql，这下好了，我用spark两年了，对用法和性能算是踩过一些坑了。听说flink挺快的，那么flinkSQL和sparkSQL到底哪个快呢？想必很多人也想知道吧，那就拿数据说话（虽然不是自己做的基线测试，但好歹也找了好久）下图是hive, s ...

分类：数据库时间：2018-10-30 19:28:12 阅读次数：429

SparkSql处理嵌套json数据

一、数据准备：代码示例：二、数据准备代码示例： ...

分类：数据库时间：2018-10-19 19:48:57 阅读次数：592

sparksql错误报No such file or director

今天在非hadoop用户使用sparksql处理这个句型遇到以下的错误。修复方式：将操作系统上的/tmp/hadoop hadoop的可写权限赋给nonhadoop用户，安全的方法是将用户加到相应的组，测试环境可以直接使用权限配置。 ...

分类：数据库时间：2018-10-18 00:49:29 阅读次数：732

Spark SQL大数据处理并写入Elasticsearch

SparkSQL(Spark用于处理结构化数据的模块) 通过SparkSQL导入的数据可以来自MySQL数据库、Json数据、Csv数据等，通过load这些数据可以对其做一系列计算下面通过程序代码来详细查看SparkSQL导入数据并写入到ES中：数据集：北京市PM2.5数据 Spark版本：2. ...

分类：数据库时间：2018-10-17 00:26:13 阅读次数：1150

spark-sql执行流程分析

spark-sql 架构图1 图1是sparksql的执行架构，主要包括逻辑计划和物理计划几个阶段，下面对流程详细分析。 sql执行流程总体流程 SQLConf中的`spark.sql.variable.substitute`，默认是可用的；参考` SparkSqlParser` 其中`Sess ...

分类：数据库时间：2018-10-09 20:05:31 阅读次数：633

共306条上一页 1 ... 11 12 13 14 15 ... 31 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)