搜索关键字：hadoop生态圈，搜索到121个结果！码迷,mamicode.com！

spark笔记

spark笔记big dataspark 比较Hadoop生态圈：MapReduce Hive Storm Yarn Sqoop Flume HDFSSpark它会代替Hadoop:不能,可能会替代MR炒作社区比较完善hadoop3.0作者：Doug cutting(hadoop以后也要走内存)S... ...

分类：其他好文时间：2017-04-27 17:48:36 阅读次数：242

（第8篇）实时可靠的开源分布式实时计算系统——Storm

摘要: 在Hadoop生态圈中，针对大数据进行批量计算时，通常需要一个或者多个MapReduce作业来完成，但这种批量计算方式是满足不了对实时性要求高的场景。那Storm是怎么做到的呢？博主福利给大家赠送一套hadoop视频课程授课老师是百度 hadoop 核心架构师内容包括hadoop入门 ...

分类：其他好文时间：2017-04-25 15:08:59 阅读次数：179

（第9篇）大数据的的超级应用——数据挖掘-推荐系统

摘要: 当我们搜集好了庞大的数据，那我们要怎么利用他们来指导推荐系统呢？博主福利给大家赠送一套hadoop视频课程授课老师是百度 hadoop 核心架构师内容包括hadoop入门、hadoop生态架构以及大型hadoop商业实战案例。讲的很细致， MapReduce 就讲了 15 个小时。 ...

分类：其他好文时间：2017-04-25 14:54:04 阅读次数：280

大数据技术（1）流式计算与Storm

2011年在海量数据处理领域，Hadoop是人们津津乐道的技术，Hadoop不仅可以用来存储海量数据，还以用来计算海量数据。因为其高吞吐、高可靠等特点，很多互联网公司都已经使用Hadoop来构建数据仓库，高频使用并促进了Hadoop生态圈的各项技术的发展。一般来讲，根据业务需求，数据的处理可以分为离... ...

分类：其他好文时间：2017-04-18 19:15:35 阅读次数：210

Ambari 介绍

Ambari 是 Apache Software Foundation 的一个顶级开源项目，是一个集中部署、管理、监控 Hadoop 分布式集群的工具。但是这里的 Hadoop 是一个广义概念，并不仅仅指的是 Hadoop（HDFS、MapReduce），而是指 Hadoop 生态圈（包括 Spar ...

分类：其他好文时间：2017-04-13 19:19:39 阅读次数：446

HIve的安装和使用

1.Hive1.1 在hadoop生态圈中属于数据仓库的角色。他能够管理hadoop中的数据，同时可以查询hadoop中的数据。本质上讲，hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。 hive有一套映射工具，可以把SQL转换为MapReduce中 ...

分类：其他好文时间：2017-04-09 00:15:55 阅读次数：258

深入MaxCompute理解数据、运算和用户的大脑：基于代价的优化器

回顾大数据技术领域大事件，最早可追溯到06年Hadoop的正式启动，而环顾四下，围绕着数据库及数据处理引擎，业内充斥着各种各样的大数据技术。这是个技术人的好时代，仅数据库领域热门DB就有300+，围绕着Hadoop生态圈的大数据处理技术更是繁花似锦。在云栖社区2017在线技术峰会大数据技术峰会上，阿 ...

分类：其他好文时间：2017-03-14 13:13:48 阅读次数：190

非常复杂，上双11数据大屏背后的秘密：大规模流式增量计算及应用

回顾大数据技术领域大事件，最早可追溯到06年Hadoop的正式启动，而环顾四下，围绕着数据库及数据处理引擎，业内充斥着各种各样的大数据技术。这是个技术人的好时代，仅数据库领域热门DB就有300+，围绕着Hadoop生态圈的大数据处理技术更是繁花似锦。在云栖社区2017在线技术峰会大数据技术峰会上，阿 ...

分类：其他好文时间：2017-03-14 13:13:17 阅读次数：156

Hive2.1.1的安装

Hive2.1.1的安装 1.1 在Hadoop生态圈中属于数据仓库的角色。Hive能够管理Hadoop中的数据，同时可以查询Hadoop中的数据。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。 1.2 Hive定义 ...

分类：其他好文时间：2017-03-05 20:43:46 阅读次数：185

[转]hadoop,spark,storm,pig,hive,mahout等到底有什么区别和联系？

摘自知乎大神的论述作者：Xiaoyu Ma链接：https://www.zhihu.com/question/27974418/answer/38965760来源：知乎著作权归作者所有，转载请联系作者获得授权。大数据本身是个很宽泛的概念，Hadoop生态圈（或者泛生态圈）基本上都是为了处理超过单 ...

分类：其他好文时间：2017-02-11 21:48:25 阅读次数：258