搜索关键字：ansible playbook hadoop，搜索到16441个结果！码迷,mamicode.com！

分布式-ubuntu12.04上安装hadoop1.2.1

在hadoop1.2.1的安装说明中有说明要预先安装java，我安装了好多版本的java以及好多版本的hadoop，然后发现oracle-java7与hadoop1.2.1是可以匹配的。一，安装具体步骤如下： 1. 安装java： sudo apt-get install oracle-java7-installer 2. 安装hadoop1.2.1： http://hadoop....

分类：其他好文时间：2014-07-11 00:31:01 阅读次数：265

Hadoop常见异常及其解决方案

1、Shell$ExitCodeException 现象：运行hadoop job时出现如下异常： 14/07/09 14:42:50 INFO mapreduce.Job: Task Id : attempt_1404886826875_0007_m_000000_1, Status : FAILED Exception from container-launch: org.apache....

分类：其他好文时间：2014-07-11 00:24:58 阅读次数：355

在执行生成Hfile的MR任务的时候出现client端的OOM

在执行MR将HDFS转换为HFile的时候，出现了如下异常： 14/07/09 18:02:59 INFO mapred.JobClient: map 83% reduce 0% 14/07/09 18:02:59 INFO mapred.JobClient: Task Id : attempt_201401091245_59030413_m_000001_0, Status : FAILE...

分类：其他好文时间：2014-07-10 23:32:44 阅读次数：323

Spark SQL with Hive

Spark1.1发布后会支持Spark SQL CLI ， Spark SQL的CLI会要求被连接到一个Hive Thrift Server上，来实现类似hive shell的功能。...

分类：数据库时间：2014-07-10 21:14:38 阅读次数：737

Spark上对SequenceFile的支持

本文介绍了spark对hadoop sequencefile的读写支持，实现方式以及简单的使用方法。sequencefile和textfile类似，在上下文里有直接提供读取方法，但最终走的还是hadoopFile方法。...

分类：其他好文时间：2014-07-10 17:11:52 阅读次数：951

HDFS详解

【一】HDFS简介 HDFS的基本概念1.1、数据块(block) HDFS(Hadoop Distributed File System)默认的最基本的存储单位是64M的数据块。和普通文件系统相同的是，HDFS中的文件是被分成64M一块的数据块存储的。不同于普通文件系统的是，HDFS中，如果一...

分类：其他好文时间：2014-07-10 16:51:14 阅读次数：304

Hadoop体系结构

HDFS和Mapreduce是Hadoop的两大核心。整个Hadoop的体系结构主要是通过HDFS来实现分布式存储的底层支持，MapReduce来实现分布式并行任务处理的程序支持。HDFSHDFS采用了主从（Master/Slave）结构模型，一个HDFS集群是由一个NameNode和若干个Data...

分类：其他好文时间：2014-07-10 15:36:19 阅读次数：204

(转)Hadoop生态系统

以下图1是hadoop生态图，通俗的说，就是hadoop核心模块和衍生的子项目。图 1 Hadoop生态系统图由图可知，hadoop生态系统包括以下成员：① 各种浏览器，产生海量的Web数据；② Nutch项目，一个快速搜索海量网页的开源项目③ HDFS，Hadoop分布式文件系统，大数据的存储系...

分类：其他好文时间：2014-07-10 15:32:23 阅读次数：189

MapReduce工作机制

MapReduce任务执行总流程以下图5 是MapReduce作业详细的执行流程图。图 5 MapReduce 作业执行流程图1.在客户端（Client）编写MapReduce代码，配置作业，启动作业。这里需要注意的一点是：一个MapReduce作业在提交到Hadoop上之后，会进入完全地自动化执...

分类：其他好文时间：2014-07-10 15:02:50 阅读次数：307

Hadoop 项目及结构

现在 Hadoop 已经发展成为包含多个子项目的集合。虽然其核心内容是 MapReduce 和Hadoop 分布式文件系统（HDFS），但 Hadoop 下的Common 、Avro、 Chukwa、Hive 、HBase等子项目也是不可或缺的。它们提供了互补性服务或在核心层上提供了更高层的服务。以...

分类：其他好文时间：2014-07-10 14:57:00 阅读次数：333

共16441条上一页 1 ... 1588 1589 1590 1591 1592 ... 1645 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)