搜索关键字：hadoop生态圈，搜索到121个结果！码迷,mamicode.com！

大数据处理之流式计算简介

简介Strom是一个开源的分布式流式计算系统，用来处理流式的数据，被称作为流式的hadoop，在电信行业，可以用来做大流量预警、终端营销、访问竞争对手产品从而做挽留等业务。本文将从storm在hadoop生态圈中所处位置、storm中术语、storm平台搭建、storm应用程序构建等详细介绍st..

分类：其他好文时间：2015-10-20 12:26:05 阅读次数：521

Spark修炼之道（进阶篇）——Spark入门到精通：第二节 Hadoop、Spark生成圈简介

本节主要内容 Hadoop生态圈 Spark生态圈 1. Hadoop生态圈原文地址：http://os.51cto.com/art/201508/487936_all.htm#rd?sukey=a805c0b270074a064cd1c1c9a73c1dcc953928bfe4a56cc94d6f67793fa02b3b983df6df92dc418df5a1083411b53325 下图给出...

分类：其他好文时间：2015-09-19 13:54:25 阅读次数：673

大数据笔记02：大数据之Hadoop的生态系统和版本

1.Hadoop的生态系统：（1）图1：（2）图2：图1 和图2 都是形象说明了Hadoop的生态圈。2.举例介绍Hadoop生态圈的小工具：（1）Hive工具（中文意思：小蜜蜂）利用Hive这个工具，不用编写复杂的Hadoop程序，只需要编写一个SQL语句，Hive就会把你编写的SQL语句转化为...

分类：其他好文时间：2015-09-16 17:23:38 阅读次数：313

Hive

1.Hive概述1.1在hadoop生态圈中属于数据仓库的角色。它能够管理hadoop中的数据，同时可以查询hadoop中的数据。本质上讲，hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。 hive有一套映射工具，可以把SQL转换为Map...

分类：其他好文时间：2015-08-17 19:28:48 阅读次数：197

Hadoop生态系统

Hadoop 生态圈commonArvoMapReduceHDFSPigHive 一个分布式、按列存储的数据仓库。Hive管理HDFS中存储的数据，并提供基于SQL的查询语言（由运行时引擎翻译成MapReduce作业）用以查询数据。HBase 一个分布式、按列存储数据库。HBase使用HD...

分类：其他好文时间：2015-08-11 10:02:45 阅读次数：132

了解大数据的技术生态系统 Hadoop,hive,spark(转载)

首先给出原文链接：原文链接大数据本身是一个很宽泛的概念，Hadoop生态圈（或者泛生态圈）基本上都是为了处理超过单机尺度的数据处理而诞生的。你能够把它比作一个厨房所以须要的各种工具。锅碗瓢盆，各有各的用处。互相之间又有重合。你能够用汤锅直接当碗吃饭喝汤，你能够用小刀或者刨子去皮。可...

分类：其他好文时间：2015-08-09 13:50:21 阅读次数：163

Hadoop之——Hive笔记

1.Hive 1.1在hadoop生态圈中属于数据仓库的角色。他能够管理hadoop中的数据，同时可以查询hadoop中的数据。本质上讲，hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。 hive有一套映射工具，可以把SQL转换为MapReduce中的job，可以把SQL中的表、字段转换为HDFS中的文件(夹)以及文件中的列。...

分类：其他好文时间：2015-06-15 00:18:25 阅读次数：98

Apache Hadoop 和Hadoop生态圈

Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。HDFS放宽了（relax）POSIX的要求，可以以流的形式访问（streaming access）文件系统中的数据。Hadoop的框架最核心的设计就是：HDFS和MapRedu...

分类：Web程序时间：2015-06-10 19:32:12 阅读次数：130

数据仓库工具：Hive

为什么要选择Hive基于Hadoop的大数据的计算/扩展能力支持SQL like查询语言统一的元数据管理简单编程Hive:Hive 可以对数据进行管理和查询。在hadoop生态圈中属于数据仓库的角色。他能够管理hadoop中的数据，同时可以查询hadoop中的数据。本质上讲，hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。 hiv...

分类：其他好文时间：2015-06-09 22:00:08 阅读次数：122

看懂大数据的技术生态圈 Hadoop,hive,spark(转载)

先给出原文链接：原文链接大数据本身是个很宽泛的概念，Hadoop生态圈（或者泛生态圈）基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆，各有各的用处，互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤，你可以用小刀或者刨子去皮。但是每个工具有自己的特性，虽然奇怪的组合也能工作，但是未必是最佳选择。大数据，首先你要能存的下大数据。传统的文件系统是单机的...

分类：其他好文时间：2015-06-04 11:50:20 阅读次数：167

共121条上一页 1 ... 9 10 11 12 13 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)