码迷,mamicode.com
首页 >  
搜索关键字:hadoop生态圈    ( 121个结果
大数据处理之流式计算简介
简介Strom是一个开源的分布式流式计算系统,用来处理流式的数据,被称作为流式的hadoop,在电信行业,可以用来做大流量预警、终端营销、访问竞争对手产品从而做挽留等业务。本文将从storm在hadoop生态圈中所处位置、storm中术语、storm平台搭建、storm应用程序构建等详细介绍st..
分类:其他好文   时间:2015-10-20 12:26:05    阅读次数:521
Spark修炼之道(进阶篇)——Spark入门到精通:第二节 Hadoop、Spark生成圈简介
本节主要内容 Hadoop生态圈 Spark生态圈 1. Hadoop生态圈原文地址:http://os.51cto.com/art/201508/487936_all.htm#rd?sukey=a805c0b270074a064cd1c1c9a73c1dcc953928bfe4a56cc94d6f67793fa02b3b983df6df92dc418df5a1083411b53325 下图给出...
分类:其他好文   时间:2015-09-19 13:54:25    阅读次数:673
大数据笔记02:大数据之Hadoop的生态系统和版本
1.Hadoop的生态系统:(1)图1:(2)图2:图1 和 图2 都是形象说明了Hadoop的生态圈。2.举例介绍Hadoop生态圈的小工具:(1)Hive工具(中文意思:小蜜蜂)利用Hive这个工具,不用编写复杂的Hadoop程序,只需要编写一个SQL语句,Hive就会把你编写的SQL语句转化为...
分类:其他好文   时间:2015-09-16 17:23:38    阅读次数:313
Hive
1.Hive概述1.1在hadoop生态圈中属于数据仓库的角色。它能够管理hadoop中的数据,同时可以查询hadoop中的数据。 本质上讲,hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。 hive有一套映射工具,可以把SQL转换为Map...
分类:其他好文   时间:2015-08-17 19:28:48    阅读次数:197
Hadoop生态系统
Hadoop 生态圈commonArvoMapReduceHDFSPigHive 一个分布式、按列存储的数据仓库。Hive管理HDFS中存储的数据,并提供基于SQL的查询语言(由运行时引擎翻译成MapReduce作业)用以查询数据。HBase 一个分布式、按列存储数据库。HBase使用HD...
分类:其他好文   时间:2015-08-11 10:02:45    阅读次数:132
了解大数据的技术生态系统 Hadoop,hive,spark(转载)
首先给出原文链接: 原文链接大数据本身是一个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你能够把它比作一个厨房所以须要的各种工具。锅碗瓢盆,各有各的用处。互相之间又有重合。你能够用汤锅直接当碗吃饭喝汤,你能够用小刀或者刨子去皮。可...
分类:其他好文   时间:2015-08-09 13:50:21    阅读次数:163
Hadoop之——Hive笔记
1.Hive 1.1在hadoop生态圈中属于数据仓库的角色。他能够管理hadoop中的数据,同时可以查询hadoop中的数据。   本质上讲,hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。   hive有一套映射工具,可以把SQL转换为MapReduce中的job,可以把SQL中的表、字段转换为HDFS中的文件(夹)以及文件中的列。...
分类:其他好文   时间:2015-06-15 00:18:25    阅读次数:98
Apache Hadoop 和Hadoop生态圈
Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。Hadoop的框架最核心的设计就是:HDFS和MapRedu...
分类:Web程序   时间:2015-06-10 19:32:12    阅读次数:130
数据仓库工具:Hive
为什么要选择Hive基于Hadoop的大数据的计算/扩展能力 支持SQL like查询语言 统一的元数据管理 简单编程Hive:Hive 可以对数据进行管理和查询。 在hadoop生态圈中属于数据仓库的角色。他能够管理hadoop中的数据,同时可以查询hadoop中的数据。 本质上讲,hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。 hiv...
分类:其他好文   时间:2015-06-09 22:00:08    阅读次数:122
看懂大数据的技术生态圈 Hadoop,hive,spark(转载)
先给出原文链接: 原文链接大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤,你可以用小刀或者刨子去皮。但是每个工具有自己的特性,虽然奇怪的组合也能工作,但是未必是最佳选择。大数据,首先你要能存的下大数据。传统的文件系统是单机的...
分类:其他好文   时间:2015-06-04 11:50:20    阅读次数:167
121条   上一页 1 ... 9 10 11 12 13 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!