搜索关键字：spark scala，搜索到10387个结果！码迷,mamicode.com！

大数据概述

1.用图表描述Hadoop生态系统的各个组件及其关系。 2.阐述Hadoop生态系统中，HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 HDFS（Hadoop分布式文件系统）是Hadoop体系中数据存储管理的基础。它是一个高度容错的系统，能检测和应对硬件故障，用于 ...

分类：其他好文时间：2021-03-02 12:24:42 阅读次数：0

大数据概述

1.用图表描述Hadoop生态系统的各个组件及其关系。 2.阐述Hadoop生态系统中，HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 Hadoop对应于Google三驾马车：HDFS对应于GFS，即分布式文件系统，MapReduce即并行计算框架，HBase对应于 ...

分类：其他好文时间：2021-03-02 12:20:23 阅读次数：0

01 大数据概述

1.用图表描述Hadoop生态系统的各个组件及其关系。 2.阐述Hadoop生态系统中，HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 Hadoop对应于Google三驾马车：HDFS对应于GFS，即分布式文件系统，MapReduce即并行计算框架，HBase对应于 ...

分类：其他好文时间：2021-03-02 12:10:47 阅读次数：0

各种报错

1.return torch.embedding(weight, input, padding_idx, scale_grad_by_freq, sparse)RuntimeError: Expected tensor for argument #1 'indices' to have scalar ...

分类：其他好文时间：2021-03-01 13:14:12 阅读次数：0

[Spark] pyspark insertInto 去重插入数据表

pyspark有个bug, 虽然下面代码写了 write.mode("overwrite")但是不生效 spark.conf.set("hive.exec.dynamic.partition.mode", "constrict") db_df.repartition(1).write.mode("o ...

分类：其他好文时间：2021-02-23 14:14:20 阅读次数：0

Spark07-SparkSQL

在介绍 Spark SQL之前，我们先了解两种基本的数据分析方式。一、数据分析的两种方式数据分析的方式大致上可以划分为 SQL 和命令式两种。命令式在前面的 RDD部分,非常明显可以感觉的到是命令式的,主要特征是通过一个算子,可以得到一个结果,通过结果再进行后续计算。例如： sc.para ...

分类：数据库时间：2021-02-16 12:29:50 阅读次数：0

大数据开发-从cogroup的实现来看join是宽依赖还是窄依赖

前面一篇文章提到大数据开发-Spark Join原理详解,本文从源码角度来看cogroup 的join实现 1.分析下面的代码 import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} obje ...

分类：其他好文时间：2021-02-16 12:23:59 阅读次数：0

Scala编译环境搭建(mac IDEA)

前提：Java环境已就绪一、安装IDEA 二、安装插件 1、安装Scala插件Intellij IDEA->Preferences->Configure->Plugins 在输入框中输入Scala，找到Scala后，点击右边的install按钮，完成安装后重启Intellij IDEA生效 2、创 ...

分类：系统相关时间：2021-02-16 12:04:34 阅读次数：0

寒假学习日报（三十二）

今天主要是帮家里干活，做过年的准备，学习的知识不多。 package com.chapter01.hanshu object Demo03 { def main(args: Array[String]): Unit = { println(sum(10, 20, 3, 5, 7, 9)) } def ...

分类：其他好文时间：2021-02-15 12:00:55 阅读次数：0

寒假学习日报（三十）

今日学习：scala package com.chapter01.inputcon object forcon { def main(args: Array[String]): Unit = { print("to循环：") //[1,5] //这里i相当于val变量，可以写成纯函数 for (i ...

分类：其他好文时间：2021-02-09 12:22:04 阅读次数：0