码迷,mamicode.com
首页 >  
搜索关键字:spark shuffle    ( 7773个结果
pyspark dataframe save into hive
# 先定义dataframe各列的数据类型 from pyspark.sql.types import *schema = StructType([ StructField("a", NullType(), True), StructField("b", AtomicType(), True), S ...
分类:其他好文   时间:2021-01-18 11:29:36    阅读次数:0
spark学习进度25(SparkCore实战案例)
词频统计: 要求:统计Harry Potter.txt文件中出现最多单词前十位 内容样例: 代码及结果: @Test//词频统计 def WordCount(): Unit ={ val conf=new SparkConf().setMaster("local[6]").setAppName("w ...
分类:其他好文   时间:2021-01-18 11:17:13    阅读次数:0
Spark学习之SparkSQL
##SparkSQL 是什么 ##SparkSQL 初体验 ##Catalyst 优化器 ##Dataset 的特点 ##DataFrame 的作用和常见操作 ##Dataset 和 DataFrame 的异同 ...
分类:数据库   时间:2021-01-18 11:03:21    阅读次数:0
js 随机打乱数组
js 自定义一个随机函数(不像php直接内置shuffle函数): function shuffle(arr) { for (var i = arr.length - 1; i >= 0; i--) { var randomIndex = Math.floor(Math.random() * (i ...
分类:编程语言   时间:2021-01-16 12:10:18    阅读次数:0
hive性能调优
1. 设置执行引擎 set hive.execution.engine=mr;set hive.execution.engine=spark; 如果设置执行引擎为MR,那么调用Hadoop的maprecude来运行需要执行的job的程序; 如果设置执行引擎为spark,那么就会调用spark来执行任 ...
分类:其他好文   时间:2021-01-15 12:15:21    阅读次数:0
【函数分享】每日PHP函数分享(2021-1-11)
str_shuffle() 随机打乱一个字符串。 string str_shuffle ( string $str ) 参数描述 str 输入字符串。返回值:返回打乱后的字符串。实例: <?php $str = 'abcdef'; $shuffled = str_shuffle($str); // ...
分类:Web程序   时间:2021-01-13 10:40:59    阅读次数:0
Spark应用程序-任务的划分
任务的划分 ? DAGScheduler类的handleJobSubmitted方法中,有一个提交阶段的的方法: var finalStage: ResultStage = null …… finalStage = createResultStage(finalRDD, func, partitio ...
分类:其他好文   时间:2021-01-12 10:29:01    阅读次数:0
spark学习进度07(深入了解RDD)
一、案例: 1、明确需求: 在访问日志中,统计独立ip数量TOP10 2、查看数据结构: ip:是时间戳Http Method Url..... 3、明确编码步骤: 3.1 取出ip,生成一个只有ip的数据集 3.2简单清晰 3.3统计ip出现的次数 3.4排序按照ip出现的次数 3.5取出前十 4 ...
分类:其他好文   时间:2021-01-11 11:19:54    阅读次数:0
Spark应用程序执行-阶段的划分
阶段的划分 ? SparkContext对象包含有一个私有属性DAGScheduler阶段调度器,主要用于阶段的划分。在一个应用程序中,任务的提交都是从行动算子触发的。行动算子的方法内部会调用一个runJob方法,其中就有DAG调度器发挥运行Job的作用: dagScheduler.runJob(r ...
分类:其他好文   时间:2021-01-08 11:26:05    阅读次数:0
模块:re,json,pickle,time , datetime,random,猴子补丁
一、re模块 1、正则的概念: 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。(在Python中)它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行。 ...
分类:Web程序   时间:2021-01-08 11:24:16    阅读次数:0
7773条   上一页 1 ... 12 13 14 15 16 ... 778 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!