码迷,mamicode.com
首页 >  
搜索关键字:rdd    ( 1327个结果
Spark 与 JDBC、Hbase之间的交互
JDBC 以MySQL为例 读取 import java.sql.DriverManager import org.apache.spark.rdd.JdbcRDD import org.apache.spark.{SparkConf, SparkContext} /** * Author atgu ...
分类:数据库   时间:2020-05-09 23:21:09    阅读次数:86
spark利用sparkSQL将数据写入hive两种通用方式实现及比较
1.写在前面 在利用spark计算引擎将kafka或其他源数据组件的数据入hive形成数仓的过程中有两种方式,一种方式是利用spark Rdd的API将数据写入hdfs形成hdfs文件,之后再将文件和hdfs文件和hive表做加载映射。第二种方式是利用sparkSQL将获取的数据Rdd转换成data ...
分类:数据库   时间:2020-05-09 19:20:15    阅读次数:100
Spark中rdd分区数量的决定因素
1、参数配置(并行度)分区的默认个数等于对spark.default.parallelism的指定值2、根据父rdd的reduceTask数量3、读取hdfs的文件生成的rddrdd分区的数量等于hdfs的文件的block4、sparkStreaming生成的rdd根据block interval, ...
分类:其他好文   时间:2020-05-08 16:12:24    阅读次数:129
sparkcore sparksql单词统计—切分-聚合
1 package com.bawei.core 2 3 import org.apache.spark.rdd.RDD 4 import org.apache.spark.{SparkConf, SparkContext} 5 6 /** 7 * 单词统计 8 9 */ 10 object Spa ...
分类:数据库   时间:2020-05-05 18:27:44    阅读次数:87
四率一直_sparkcore
1 package com.bawei.review01 2 3 import org.apache.spark.rdd.RDD 4 import org.apache.spark.sql.{DataFrame, SparkSession} 5 6 case class StuScore(id:In ...
分类:其他好文   时间:2020-05-05 17:49:28    阅读次数:54
spark系列-5、RDD、DataFrame、Dataset的区别和各自的优势
一、共性 1.1、RDD 从一开始 RDD 就是 Spark 提供的面向用户的主要 API。从根本上来说,一个 RDD 就是你的数据的一个不可变的分布式元素集合,在集群中跨节点分布,可以通过若干提供了转换和处理的底层 API 进行并行处理。关于RDD的详细介绍可以参考这篇文章:https://www ...
分类:其他好文   时间:2020-05-04 17:33:48    阅读次数:56
spark工作原理
1、分布式 2、基于内存 3、迭代式计算 每一批节点上的每一批数据就是一个RDD RDD是spark的核心抽象 1、RDD是Spark提供的核心抽象,全称为Resillient Distributed Dataset,即弹性分布式数据集。2、RDD在抽象上来说是一种元素集合,包含了数据。它是被分区的 ...
分类:其他好文   时间:2020-05-03 20:41:36    阅读次数:61
spark系列-2、Spark 核心数据结构:弹性分布式数据集 RDD
一、RDD(弹性分布式数据集) RDD 是 Spark 最核心的数据结构,RDD(Resilient Distributed Dataset)全称为弹性分布式数据集,是 Spark 对数据的核心抽象,也是最关键的抽象,它实质上是一组分布式的 JVM 不可变对象集合,不可变决定了它是只读的,所以 RD ...
分类:其他好文   时间:2020-05-02 14:51:21    阅读次数:56
spark写入mysql
第一种方式: private def singleDataSaveMysql(sql: String) = { val dataFrame2: DataFrame = ss.sql(sql) val resultRDD = df2rdd(dataFrame2) val value: RDD[Map[ ...
分类:数据库   时间:2020-04-28 17:18:05    阅读次数:50
Spark小实例——求文件中的最大值和最小值(IDEA实现)
Spark小实例——求文件中的最大值和最小值(IDEA实现)
分类:其他好文   时间:2020-04-27 22:38:23    阅读次数:162
1327条   上一页 1 ... 12 13 14 15 16 ... 133 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!