码迷,mamicode.com
首页 >  
搜索关键字:ansible playbook hadoop    ( 16441个结果
分布式-ubuntu12.04上安装hadoop1.2.1
在hadoop1.2.1的安装说明中有说明要预先安装java,我安装了好多版本的java以及好多版本的hadoop,然后发现oracle-java7与hadoop1.2.1是可以匹配的。 一,安装具体步骤如下: 1. 安装java: sudo apt-get install oracle-java7-installer 2. 安装hadoop1.2.1: http://hadoop....
分类:其他好文   时间:2014-07-11 00:31:01    阅读次数:265
Hadoop常见异常及其解决方案
1、Shell$ExitCodeException 现象:运行hadoop job时出现如下异常: 14/07/09 14:42:50 INFO mapreduce.Job: Task Id : attempt_1404886826875_0007_m_000000_1, Status : FAILED Exception from container-launch: org.apache....
分类:其他好文   时间:2014-07-11 00:24:58    阅读次数:355
在执行生成Hfile的MR任务的时候出现client端的OOM
在执行MR将HDFS转换为HFile的时候,出现了如下异常: 14/07/09 18:02:59 INFO mapred.JobClient:  map 83% reduce 0% 14/07/09 18:02:59 INFO mapred.JobClient: Task Id : attempt_201401091245_59030413_m_000001_0, Status : FAILE...
分类:其他好文   时间:2014-07-10 23:32:44    阅读次数:323
Spark SQL with Hive
Spark1.1发布后会支持Spark SQL CLI , Spark SQL的CLI会要求被连接到一个Hive Thrift Server上,来实现类似hive shell的功能。...
分类:数据库   时间:2014-07-10 21:14:38    阅读次数:737
Spark上对SequenceFile的支持
本文介绍了spark对hadoop sequencefile的读写支持,实现方式以及简单的使用方法。sequencefile和textfile类似,在上下文里有直接提供读取方法,但最终走的还是hadoopFile方法。...
分类:其他好文   时间:2014-07-10 17:11:52    阅读次数:951
HDFS详解
【一】HDFS简介 HDFS的基本概念1.1、数据块(block) HDFS(Hadoop Distributed File System)默认的最基本的存储单位是64M的数据块。 和普通文件系统相同的是,HDFS中的文件是被分成64M一块的数据块存储的。 不同于普通文件系统的是,HDFS中,如果一...
分类:其他好文   时间:2014-07-10 16:51:14    阅读次数:304
Hadoop体系结构
HDFS和Mapreduce是Hadoop的两大核心。整个Hadoop的体系结构主要是通过HDFS来实现分布式存储的底层支持,MapReduce来实现分布式并行任务处理的程序支持。HDFSHDFS采用了主从(Master/Slave)结构模型,一个HDFS集群是由一个NameNode和若干个Data...
分类:其他好文   时间:2014-07-10 15:36:19    阅读次数:204
(转)Hadoop生态系统
以下图1是hadoop生态图,通俗的说,就是hadoop核心模块和衍生的子项目。 图 1 Hadoop生态系统图由图可知,hadoop生态系统包括以下成员:① 各种浏览器,产生海量的Web数据;② Nutch项目,一个快速搜索海量网页的开源项目③ HDFS,Hadoop分布式文件系统,大数据的存储系...
分类:其他好文   时间:2014-07-10 15:32:23    阅读次数:189
MapReduce工作机制
MapReduce任务执行总流程以下图5 是MapReduce作业详细的执行流程图。 图 5 MapReduce 作业执行流程图1.在客户端(Client)编写MapReduce代码,配置作业,启动作业。这里需要注意的一点是:一个MapReduce作业在提交到Hadoop上之后,会进入完全地自动化执...
分类:其他好文   时间:2014-07-10 15:02:50    阅读次数:307
Hadoop 项目及结构
现在 Hadoop 已经发展成为包含多个子项目的集合。虽然其核心内容是 MapReduce 和Hadoop 分布式文件系统(HDFS),但 Hadoop 下的Common 、Avro、 Chukwa、Hive 、HBase等子项目也是不可或缺的。它们提供了互补性服务或在核心层上提供了更高层的服务。以...
分类:其他好文   时间:2014-07-10 14:57:00    阅读次数:333
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!