码迷,mamicode.com
首页 >  
搜索关键字:sparkconf    ( 176个结果
Spark分析sogou日志, RDD
import com.hankcs.hanlp.HanLPimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}import scala.collection.immutable.StringO ...
分类:其他好文   时间:2021-07-02 16:33:14    阅读次数:0
SparkSQL读写JDBC
1.向JDBC读数据 object SparkSQL02_Datasource { def main(args: Array[String]): Unit = { //创建上下文环境配置对象 val conf: SparkConf = new SparkConf().setMaster("local ...
分类:数据库   时间:2021-05-24 05:59:48    阅读次数:0
本地调试spark
1、改成本地模式 . val conf = new SparkConf().setAppName("ScalaWordCount").setMaster("local") 2、编写入参 传参 ...
分类:其他好文   时间:2021-04-24 13:30:06    阅读次数:0
大数据开发-从cogroup的实现来看join是宽依赖还是窄依赖
前面一篇文章提到大数据开发-Spark Join原理详解,本文从源码角度来看cogroup 的join实现 1.分析下面的代码 import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} obje ...
分类:其他好文   时间:2021-02-16 12:23:59    阅读次数:0
spark学习进度25(SparkCore实战案例)
词频统计: 要求:统计Harry Potter.txt文件中出现最多单词前十位 内容样例: 代码及结果: @Test//词频统计 def WordCount(): Unit ={ val conf=new SparkConf().setMaster("local[6]").setAppName("w ...
分类:其他好文   时间:2021-01-18 11:17:13    阅读次数:0
Spark ML 特征处理类之 VectorAssembler 向量装配转换器/VectorIndexer
一、VectorAssembler package com.home.spark.ml import org.apache.spark.SparkConf import org.apache.spark.ml.feature.VectorAssembler import org.apache.spa ...
分类:其他好文   时间:2020-10-18 09:57:35    阅读次数:15
spark 广播变量 累加器
广播变量object Main { def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setAppName("readMysql").setMaster("local[2]") val sparkConte ...
分类:其他好文   时间:2020-07-19 11:44:16    阅读次数:62
pyspark读取elasticsearch
代码: import json from pyspark.sql import SparkSession from pyspark import SparkConf def trans_form(data_tuple): """ 对从es读取出来的每一条数据进行格式转换 :param data_tu ...
分类:其他好文   时间:2020-07-17 22:12:04    阅读次数:101
基于pySpark得地震数据处理与分析
项目来源厦门大学林子雨老师得Spark学习项目中,里面为部分项目代码和实验截图 读取文件 from pyspark import SparkConf, SparkContext from pyspark.sql import SparkSession from pyspark.ml.feature ...
分类:其他好文   时间:2020-07-03 19:04:21    阅读次数:89
Spark 与 JDBC、Hbase之间的交互
JDBC 以MySQL为例 读取 import java.sql.DriverManager import org.apache.spark.rdd.JdbcRDD import org.apache.spark.{SparkConf, SparkContext} /** * Author atgu ...
分类:数据库   时间:2020-05-09 23:21:09    阅读次数:86
176条   1 2 3 4 ... 18 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!