码迷,mamicode.com
首页 >  
搜索关键字:计算引擎    ( 142个结果
大数据计算引擎之Flink Flink CEP复杂事件编程
基础概念 FlinkCEP 说明 一个或多个由简单事件构成的事件流通过一定的规则匹配,然后输出用户想得到的数据,满足规则的复杂事件。具备如下的特征: 目标:从有序的简单事件流中发现一些高阶特征 输入:一个或多个由简单事件构成的事件流 处理:识别简单事件之间的内在联系,多个符合一定规则的简单事件构成复 ...
分类:其他好文   时间:2019-12-30 10:00:03    阅读次数:130
Spark原理及关键技术点
Spark Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同 ...
分类:其他好文   时间:2019-12-27 00:11:15    阅读次数:106
大数据计算引擎之Flink Flink状态管理和容错
这里将介绍Flink对有状态计算的支持,其中包括状态计算和无状态计算的区别,以及在Flink中支持的不同状态类型,分别有 Keyed State 和 Operator State 。另外针对状态数据的持久化,以及整个 Flink 任务的数据一致性保证,Flink 提供了 Checkpoint 机制处 ...
分类:其他好文   时间:2019-12-24 18:32:48    阅读次数:94
大数据计算引擎之Flink Flink状态管理和容错
这里将介绍Flink对有状态计算的支持,其中包括状态计算和无状态计算的区别,以及在Flink中支持的不同状态类型,分别有 Keyed State 和 Operator State 。另外针对状态数据的持久化,以及整个 Flink 任务的数据一致性保证,Flink 提供了 Checkpoint 机制处... ...
分类:其他好文   时间:2019-12-24 09:20:00    阅读次数:88
Hive架构原理
什么是Hive Hive是由Facebook开源用于解决海量结构化日志的数据统计;Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射 成一张表,并提供类SQL查询功能,底层计算引擎默认为Hadoop的MapReduce(本质是将sql转化成mapreduce程序),可以将引擎更 ...
分类:其他好文   时间:2019-12-14 15:25:15    阅读次数:129
Spark相关知识
基本概念: Spark作为新一代大数据计算引擎,因为内存计算的特性,具有比hadoop更快的计算速度。是一个分布式计算框架,旨在简化运行于计算机集群上的并行程序的编写。RDD:是spark核心数据处理模型,弹性分布式数据集(Resilient Distributed Dataset)是分布式内存的一 ...
分类:其他好文   时间:2019-11-26 16:12:00    阅读次数:95
业务领域建模Domain Modeling
一、收集应用领域信息 我做的题目是海量用户行为实时分析系统的设计与实现。需要设计并实现一个基于流计算的实时计算引擎。目前常用的实时流计算引擎有Flink、Storm等。其主要实现方法是基于事件流,根据用户给定的条件进行实时处理,最后输出用户需要的结果。 二、头脑风暴 根据需求,我们讨论并整理出了技术 ...
分类:其他好文   时间:2019-11-22 20:55:09    阅读次数:82
Flink01
1. 什么是Flink? 1.1 4代大数据计算引擎 第一代: MapReducer 批处理 Mapper, Reducer Hadoop的MapReducer将计算分为两个阶段, 分别为Map和Reducer. 对于上层应用来说, 就不得不想方设法去拆分算法, 甚至于不得不在上层应用实现多个Job ...
分类:其他好文   时间:2019-11-17 17:29:10    阅读次数:62
大数据-spark
Spark是用于大规模数据处理的快速通用的计算引擎。 相较MR快的原因:其任务中间结果存在内存中,在迭代运算中尤为明显,DAG的设置。 架构说明: Dirver:负责节点通讯,task分发,结果回收 Worker:资源管理的从节点 Master:资源调度的主节点 Dirver:负责节点通讯,task ...
分类:其他好文   时间:2019-11-01 10:00:23    阅读次数:98
spark教程(一)-入门与安装
spark 简介 建议先阅读我的博客 大数据基础架构 spark 一个通用的计算引擎,专门为大规模数据处理而设计,与 mapreduce 类似,不同的是,mapreduce 把中间结果 写入 hdfs,而 spark 直接写入 内存,这使得它能够实现实时计算。 spark 由 scala 语言开发, ...
分类:其他好文   时间:2019-10-02 12:51:02    阅读次数:1950
142条   上一页 1 2 3 4 5 ... 15 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!