码迷,mamicode.com
首页 >  
搜索关键字:spark streaming 作业 容错    ( 29616个结果
Trino总结
文章目录 1.Trino与Spark SQL的区别分析 2.Trino与Spark SQL解析过程对比 3.Trino基本概念 4.Trino架构 5.Trino SQL执行流程 6.Trino Task执行流程 相关参考: 1.Trino与Spark SQL的区别分析 2.Trino与Spark ...
分类:其他好文   时间:2021-01-22 12:05:01    阅读次数:0
Hive整合Hbase
HBase 虽然可以存储数亿或数十亿行数据,但是对于数据分析来说,不太友好,只提供了简单的基于 Key 值的快速查询能力,没法进行大量的条件查询。现有hbase的查询工具有很多如:Hive,Tez,Impala,Shark/Spark,Phoenix等。今天主要说Hive,Hive方便地提供了Hiv ...
分类:其他好文   时间:2021-01-21 10:54:30    阅读次数:0
Spark学习--Structured Streaming
Structured Streaming Structured Streaming 是 Spark Streaming 的进化版 Spark 编程模型的进化过程 总结 RDD 的优点 面向对象的操作方式 可以处理任何类型的数据 RDD 的缺点 运行速度比较慢, 执行过程没有优化 API 比较僵硬, ...
分类:其他好文   时间:2021-01-18 11:40:47    阅读次数:0
关于org.apache.poi 导出excel时引发的No such file or directory
java.lang.RuntimeException: java.io.IOException: No such file or directory at org.apache.poi.xssf.streaming.SXSSFWorkbook.createAndRegisterSXSSFSheet( ...
分类:Web程序   时间:2021-01-18 11:31:01    阅读次数:0
pyspark dataframe save into hive
# 先定义dataframe各列的数据类型 from pyspark.sql.types import *schema = StructType([ StructField("a", NullType(), True), StructField("b", AtomicType(), True), S ...
分类:其他好文   时间:2021-01-18 11:29:36    阅读次数:0
spark学习进度25(SparkCore实战案例)
词频统计: 要求:统计Harry Potter.txt文件中出现最多单词前十位 内容样例: 代码及结果: @Test//词频统计 def WordCount(): Unit ={ val conf=new SparkConf().setMaster("local[6]").setAppName("w ...
分类:其他好文   时间:2021-01-18 11:17:13    阅读次数:0
【Linux】Linux学习之文件查找、文件打包和解压缩、文件系统操作与磁盘管理、帮助命令、任务计划crontab
6.文件查找 与搜索相关的命令常用的有whereis、which、find和locate。 whereis简单快速 whereis <关键词> whereis搜索很快,因为其并没有从硬盘中依次查找,而是直接从数据库中查询。缺点是只能搜索二进制文件(-b)、man帮助文件(-m)和源代码文件(-s)。 ...
分类:系统相关   时间:2021-01-18 11:07:41    阅读次数:0
Spark学习之SparkSQL
##SparkSQL 是什么 ##SparkSQL 初体验 ##Catalyst 优化器 ##Dataset 的特点 ##DataFrame 的作用和常见操作 ##Dataset 和 DataFrame 的异同 ...
分类:数据库   时间:2021-01-18 11:03:21    阅读次数:0
hive性能调优
1. 设置执行引擎 set hive.execution.engine=mr;set hive.execution.engine=spark; 如果设置执行引擎为MR,那么调用Hadoop的maprecude来运行需要执行的job的程序; 如果设置执行引擎为spark,那么就会调用spark来执行任 ...
分类:其他好文   时间:2021-01-15 12:15:21    阅读次数:0
Spark应用程序-任务的划分
任务的划分 ? DAGScheduler类的handleJobSubmitted方法中,有一个提交阶段的的方法: var finalStage: ResultStage = null …… finalStage = createResultStage(finalRDD, func, partitio ...
分类:其他好文   时间:2021-01-12 10:29:01    阅读次数:0
29616条   上一页 1 ... 14 15 16 17 18 ... 2962 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!