搜索关键字：mapreduce streaming，搜索到5217个结果！码迷,mamicode.com！

大型网络技术架构3

大型网络技术架构3 2020.3.14 分层最常见的架构模式，将系统在横向维度上切分成几个部分，每个部分单一职责。网站一般分为三个层次：应用层、服务层和数据层，过分层，一个庞大系统切分成不同部分，便于分工合作和维护。分割：分割是在纵向方面对软件进行切分->将不同的功能和服务分割开来，包装成高内 ...

分类：其他好文时间：2020-06-13 21:06:18 阅读次数：57

Spark Structured Streaming（二）实战

5. 实战Structured Streaming 5.1. Static版本先读一份static 数据： val static = spark.read.json("s3://tang-spark/data/activity-data/") static.printSchema root |-- ...

分类：其他好文时间：2020-06-12 12:48:53 阅读次数：137

Apache Spark有哪些局限性

ApacheSpark是行业中流行和广泛使用的大数据工具之一。ApacheSpark已成为业界的热门话题，并且如今非常流行。但工业正在转移朝向apacheflink。ApacheSpark简介ApacheSpark是为快速计算而设计的开源，闪电般快速的集群计算框架。ApacheSpark扩展了MapReduce模型，以有效地将其用于多种计算，包括流处理和交互式查询。ApacheSpark的主要功能

分类：Web程序时间：2020-06-12 09:14:25 阅读次数：61

入门学习python语言主要用途有哪些?

python是一门非常高级的编程语言，同时python作为人工智能的重要编程语言，无论发展前景还是就业方向，都可以说是无可限量。

分类：编程语言时间：2020-06-11 00:42:34 阅读次数：104

spark考试

第0章-课程介绍第1章-大数据技术概述第2章-Scala语言基础第3章-Spark的设计与运行原理第4章-Spark环境搭建和使用方法第5章-RDD编程第6章-Spark-SQL 第7章-Spark-Streaming 第8章-Spark-MLlib ...

分类：其他好文时间：2020-06-10 23:09:12 阅读次数：145

Flink SavePoint

一、概述 Savepoint 是检查点的一种特殊实现，底层实现其实也是使用 Checkpoint 的机制。 Savepoint 是用户以手工命令的方式触发 Checkpoint，并将结果持久化到指定的存储路径中，其主要目的是帮助用户在升级和维护集群过程中保存系统中的状态数据，避免因为停机运维或者 ...

分类：其他好文时间：2020-06-09 14:52:23 阅读次数：72

Mr与spark的shuffle过程详解及对比

恢复内容开始大数据的分布式计算框架目前使用的最多的就是hadoop的mapReduce和Spark，mapReducehe和Spark之间的最大区别是前者较偏向于离线处理，而后者重视实现性，下面主要介绍mapReducehe和Spark两者的shuffle过程。 MapReduce的Shuffle ...

分类：其他好文时间：2020-06-08 19:17:29 阅读次数：88

MapReduce源码分析--Shuffle阶段

一、收集执行NewOutputCollector对象的write方法就开启了对map输出数据的收集过程： ? collector是一个MapOutputCollector类型的变量，它是实际执行收集数据功能的对象载体： private final MapOutputCollector<K,V> c ...

分类：其他好文时间：2020-06-08 18:53:43 阅读次数：64

乱谈马拉松和mapreduce的关系

做为一个业务马拉松爱好者和一个不太专业的IT从业者（十多年开发不会，业务略懂，没形成自己的价值体系，啥啥没心得，得过且过十几年），在马拉松的时候想到了这个对照关系。那就随便写写，看到了博君一笑。 hadoop的map阶段，是通过transform操作，将数据进行转换，这个阶段数据都是在各个机器上， ...

分类：其他好文时间：2020-06-08 00:39:55 阅读次数：61

Hive的压缩存储和简单优化

一、Hive的压缩和存储 1，MapReduce支持的压缩编码压缩格式工具算法文件扩展名是否可切分对应的编码/解码器 DEFLATE 无 DEFLATE .deflate 否 org.apache.hadoop.io.compress.DefaultCodec Gzip gzip DEF ...

分类：其他好文时间：2020-06-07 19:08:04 阅读次数：65

共5217条上一页 1 ... 15 16 17 18 19 ... 522 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)