搜索关键字：spark streaming 元数据，搜索到10941个结果！码迷,mamicode.com！

spark中的持久化(cache()、persist()、checkpoint())

分类：系统相关时间：2021-04-06 14:53:55 阅读次数：0

大数据总结

学习过得技术 HDFS YARN MR HIVE HBASE SPARK SPARK(sparkCore、sparkSql、sparkStreaming) HDFS 数据库管理、存磁盘 Ha模式(在zookeeper之上) 联邦机制(把大象装进冰箱) split切片 Hbase 列式数据库半结构 ...

分类：其他好文时间：2021-04-05 12:37:34 阅读次数：0

DAOS 分布式异步对象存储｜故障模型

DAOS 依靠大规模分布式单端口存储。因此，每个 Target 实际上都是一个单独的失败点。DAOS 通过在不同的容错域中提供 Target 间的冗余来实现数据和元数据的可用性和持久性。DAOS 内部的 Pool 和 Container 的元数据通过强一致性算法进行复制。然后，通过在内部透明地利用 ... ...

分类：其他好文时间：2021-04-05 12:26:13 阅读次数：0

Spark RDD编程基础

准备文本文件从文件创建RDD lines=sc.textFile() 筛选出含某个单词的行 lines.filter()lambda 参数：条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...

分类：其他好文时间：2021-03-30 13:26:11 阅读次数：0

Java 注解（Annotation）

一、注解（Annotation） 1、概述（1）从 JDK 5.0 开始, Java 增加了对元数据(MetaData) 的支持, 也就是Annotation(注解)；（2）Annotation 其实就是代码里的特殊标记, 这些标记可以在编译, 类加载, 运行时被读取, 并执行相应的处理。通过使 ...

分类：编程语言时间：2021-03-30 13:22:27 阅读次数：0

03 Spark RDD编程基础

1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数：条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...

分类：其他好文时间：2021-03-30 13:18:46 阅读次数：0

Spark RDD编程基础

1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter() 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...

分类：其他好文时间：2021-03-30 13:05:37 阅读次数：0

03 Spark RDD基础编程

1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数：条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...

分类：其他好文时间：2021-03-30 12:53:37 阅读次数：0

Spark RDD编程

1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数：条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() 3. ...

分类：其他好文时间：2021-03-30 12:53:01 阅读次数：0

Spark RDD编程

1. 准备文本文件：从文件创建RDD lines=sc.textFile()：筛选出含某个单词的行 lines.filter()，lambda 参数：条件表达式： 2. 生成单词的列表：从列表创建RDD words=sc.parallelize()：筛选出长度大于2 的单词 words.fi ...

分类：其他好文时间：2021-03-29 12:46:01 阅读次数：0