搜索关键字：hadoop yarn搭建，搜索到13956个结果！码迷,mamicode.com！

org.apache.hadoop.hbase.master.HMasterCommandLine: Master exiting java.lang.RuntimeException: HMaster Aborted

前一篇的问题解决了，是 hbase 下面lib 包的jar问题，之前写MR的时候加错了包，替换掉了原来的包后出现另一问题：@ubuntu:/home/hadoop/hbase-0.94.6-cdh4.5.0/bin$ ./start-hbase.sh starting master, logging...

分类：编程语言时间：2014-06-26 21:41:53 阅读次数：829

hadoop函数说明图

分类：其他好文时间：2014-06-26 20:37:25 阅读次数：145

在python中使用zookeeper管理你的应用集群

http://www.zlovezl.cn/articles/40/简介： Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目，它主要是用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。具体简介可以参照这....

分类：编程语言时间：2014-06-26 18:43:35 阅读次数：281

Sqoop的使用

Sqoop官网:http://sqoop.apache.org/*) Sqoop介绍Sqoop用来在Hadoop和关系数据库中传递数据。通过sqoop，我们可以方便的将数据从关系数据库导入到HDFS，或者将数据从HDFS导出到关系数据库。参考链接:http://blog.csdn.net/yfkis...

分类：其他好文时间：2014-06-26 17:49:46 阅读次数：212

Hadoop的辉煌还能延续多久？

摘要：Hadoop已经成为大数据的代名词。短短几年间，Hadoop从一种边缘技术成为事实上的标准。而另一方面，MapReduce在谷歌已不再显赫。当企业瞩目MapReduce的时候，谷歌好像早已进入到了下一个时代。 Hadoop技术已经无处不在。不管是好是坏，Hadoop已经成为大数据的代名词。短短...

分类：其他好文时间：2014-06-26 17:02:48 阅读次数：191

流式计算框架-STORM简介

Apache Storm是一个免费、开源、分布式的实时计算系统。相对于Hadoop适用于批处理而言，利用Storm可以非常容易地对流式数据进行实时可靠处理。Storm使用简单，支持多种编程语言且非常有趣！...

分类：其他好文时间：2014-06-26 14:20:52 阅读次数：294

Spark SQL Hive Support Demo

前提：1、spark1.0的包编译时指定支持hive：./make-distribution.sh --hadoop 2.3.0-cdh5.0.0 --with-yarn--with-hive--tgz2、安装完spark1.0；3、安装与hadoop对应的CDH版本的hive；Spark SQL ...

分类：数据库时间：2014-06-26 11:24:11 阅读次数：564

_00017 Flume的体系结构介绍以及Flume入门案例(往HDFS上传数据)

# 学习前言想学习一下Flume，网上找了好多文章基本上都说的很简单，只有一半什么的，简直就是坑爹，饿顿时怒火就上来了，学个东西真不容易，然后自己耐心的把这些零零碎碎的东西整理整理，各种搭环境实验之后才弄好的，也不容易啊，希望可以帮到想学Flume的你、、、 # Flume介绍 Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制...

分类：其他好文时间：2014-06-26 08:01:52 阅读次数：449

hadoop 多目录输入，map到reduce如何排序

使用MultipleInputs.addInputPath 对多个路径输入现在假设有三个目录，并使用了三个mapper去处理，经过map处理后，输出的结果会根据key 进行join，如果使用TextPair，会根据第一个字段jion，第二个字段排序然后在作为reduce的输入，进行计算...

分类：其他好文时间：2014-06-26 07:49:51 阅读次数：250

初识 Cloudera Impala

Impala是Cloudera公司主导开发的新型查询系统，它提供SQL语义，能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义，但由于Hive底层执行使用的是MapReduce引擎，仍然是一个批处理过程，难以满足查询的交互性。相比之下，Impala的最大特点也是最大卖点就是它的快速。Impala 为存储在 HDFS 和 HBase 中的数据提供了一个实时 SQL 查询接口。...

分类：其他好文时间：2014-06-25 10:56:38 阅读次数：355

共13956条上一页 1 ... 1351 1352 1353 1354 1355 ... 1396 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)