搜索关键字：计算引擎，搜索到142个结果！码迷,mamicode.com！

大数据计算引擎之Flink Flink CEP复杂事件编程

基础概念 FlinkCEP 说明一个或多个由简单事件构成的事件流通过一定的规则匹配，然后输出用户想得到的数据，满足规则的复杂事件。具备如下的特征：目标：从有序的简单事件流中发现一些高阶特征输入：一个或多个由简单事件构成的事件流处理：识别简单事件之间的内在联系，多个符合一定规则的简单事件构成复 ...

分类：其他好文时间：2019-12-30 10:00:03 阅读次数：130

Spark原理及关键技术点

Spark Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同 ...

分类：其他好文时间：2019-12-27 00:11:15 阅读次数：106

大数据计算引擎之Flink Flink状态管理和容错

这里将介绍Flink对有状态计算的支持，其中包括状态计算和无状态计算的区别，以及在Flink中支持的不同状态类型，分别有 Keyed State 和 Operator State 。另外针对状态数据的持久化，以及整个 Flink 任务的数据一致性保证，Flink 提供了 Checkpoint 机制处 ...

分类：其他好文时间：2019-12-24 18:32:48 阅读次数：94

大数据计算引擎之Flink Flink状态管理和容错

这里将介绍Flink对有状态计算的支持，其中包括状态计算和无状态计算的区别，以及在Flink中支持的不同状态类型，分别有 Keyed State 和 Operator State 。另外针对状态数据的持久化，以及整个 Flink 任务的数据一致性保证，Flink 提供了 Checkpoint 机制处... ...

分类：其他好文时间：2019-12-24 09:20:00 阅读次数：88

Hive架构原理

什么是Hive Hive是由Facebook开源用于解决海量结构化日志的数据统计；Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射成一张表，并提供类SQL查询功能，底层计算引擎默认为Hadoop的MapReduce（本质是将sql转化成mapreduce程序），可以将引擎更 ...

分类：其他好文时间：2019-12-14 15:25:15 阅读次数：129

Spark相关知识

基本概念： Spark作为新一代大数据计算引擎，因为内存计算的特性，具有比hadoop更快的计算速度。是一个分布式计算框架，旨在简化运行于计算机集群上的并行程序的编写。RDD：是spark核心数据处理模型，弹性分布式数据集(Resilient Distributed Dataset)是分布式内存的一 ...

分类：其他好文时间：2019-11-26 16:12:00 阅读次数：95

业务领域建模Domain Modeling

一、收集应用领域信息我做的题目是海量用户行为实时分析系统的设计与实现。需要设计并实现一个基于流计算的实时计算引擎。目前常用的实时流计算引擎有Flink、Storm等。其主要实现方法是基于事件流，根据用户给定的条件进行实时处理，最后输出用户需要的结果。二、头脑风暴根据需求，我们讨论并整理出了技术 ...

分类：其他好文时间：2019-11-22 20:55:09 阅读次数：82

Flink01

1. 什么是Flink? 1.1 4代大数据计算引擎第一代: MapReducer 批处理 Mapper, Reducer Hadoop的MapReducer将计算分为两个阶段, 分别为Map和Reducer. 对于上层应用来说, 就不得不想方设法去拆分算法, 甚至于不得不在上层应用实现多个Job ...

分类：其他好文时间：2019-11-17 17:29:10 阅读次数：62

大数据-spark

Spark是用于大规模数据处理的快速通用的计算引擎。相较MR快的原因：其任务中间结果存在内存中，在迭代运算中尤为明显，DAG的设置。架构说明： Dirver：负责节点通讯，task分发，结果回收 Worker：资源管理的从节点 Master：资源调度的主节点 Dirver：负责节点通讯，task ...

分类：其他好文时间：2019-11-01 10:00:23 阅读次数：98

spark教程(一)-入门与安装

spark 简介建议先阅读我的博客大数据基础架构 spark 一个通用的计算引擎，专门为大规模数据处理而设计，与 mapreduce 类似，不同的是，mapreduce 把中间结果写入 hdfs，而 spark 直接写入内存，这使得它能够实现实时计算。 spark 由 scala 语言开发， ...

分类：其他好文时间：2019-10-02 12:51:02 阅读次数：1950

共142条上一页 1 2 3 4 5 ... 15 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)