搜索关键字：hadoop yarn搭建，搜索到13956个结果！码迷,mamicode.com！

分布式-ubuntu12.04上安装hadoop1.2.1

在hadoop1.2.1的安装说明中有说明要预先安装java，我安装了好多版本的java以及好多版本的hadoop，然后发现oracle-java7与hadoop1.2.1是可以匹配的。一，安装具体步骤如下： 1. 安装java： sudo apt-get install oracle-java7-installer 2. 安装hadoop1.2.1： http://hadoop....

分类：其他好文时间：2014-07-11 00:31:01 阅读次数：265

Hadoop常见异常及其解决方案

1、Shell$ExitCodeException 现象：运行hadoop job时出现如下异常： 14/07/09 14:42:50 INFO mapreduce.Job: Task Id : attempt_1404886826875_0007_m_000000_1, Status : FAILED Exception from container-launch: org.apache....

分类：其他好文时间：2014-07-11 00:24:58 阅读次数：355

Cannot lock storage /tmp/hadoop-root/dfs/name. The directory is already locked.

ERROR namenode.NameNode: java.io.IOException: Cannot lock storage /tmp/hadoop-root/dfs/name. The directory is already locked....

分类：其他好文时间：2014-07-11 00:23:43 阅读次数：362

在执行生成Hfile的MR任务的时候出现client端的OOM

在执行MR将HDFS转换为HFile的时候，出现了如下异常： 14/07/09 18:02:59 INFO mapred.JobClient: map 83% reduce 0% 14/07/09 18:02:59 INFO mapred.JobClient: Task Id : attempt_201401091245_59030413_m_000001_0, Status : FAILE...

分类：其他好文时间：2014-07-10 23:32:44 阅读次数：323

Spark SQL with Hive

Spark1.1发布后会支持Spark SQL CLI ， Spark SQL的CLI会要求被连接到一个Hive Thrift Server上，来实现类似hive shell的功能。...

分类：数据库时间：2014-07-10 21:14:38 阅读次数：737

Hadoop2.4.1入门实例：MaxTemperature

一、前期准备 1、创建伪分布Hadoop环境，请参考官方文档。 2、准备数据文件如下sample.txt： 12345679867623119010123456798676231190101234567986762311901012345679867623119010123456+001212345678903456 123456798676231190101234567986762311...

分类：其他好文时间：2014-07-10 19:41:45 阅读次数：479

2.HDFS操作

1.使用命令行操作1）4个通用命令行<1>archive归档文件的创建用途：由于hadoop的设计是为了处理大数据，理想的数据应该blocksize的倍数。namenode在启动时会将所有的元数据load到内存中当大量小于blocksize的文件存在的时候，，不仅占用了大量的存储空间，也占用了大量的n..

分类：其他好文时间：2014-07-10 18:56:21 阅读次数：353

hadoop版本变迁

最近在研究hadoop时，发现hadoop的版本很混乱。原来的版本都说0.X.X开始，后来发现有1.X.X和2.X.X 这样就不太清楚了。 0.20.2版本以前（不含该版本）的配置文件都在default.xml中。 0.20.x以后的版本不含有eclipse插件的jar包，由于eclipse的版本不一，所以就需要自己编译源码生成对应的插件。 0.20.2——0.22.x版本的配置文件集...

分类：其他好文时间：2014-07-10 17:43:44 阅读次数：211

Spark上对SequenceFile的支持

本文介绍了spark对hadoop sequencefile的读写支持，实现方式以及简单的使用方法。sequencefile和textfile类似，在上下文里有直接提供读取方法，但最终走的还是hadoopFile方法。...

分类：其他好文时间：2014-07-10 17:11:52 阅读次数：951

Hadoop 项目及结构

现在 Hadoop 已经发展成为包含多个子项目的集合。虽然其核心内容是 MapReduce 和Hadoop 分布式文件系统（HDFS），但 Hadoop 下的Common 、Avro、 Chukwa、Hive 、HBase等子项目也是不可或缺的。它们提供了互补性服务或在核心层上提供了更高层的服务。以...

分类：其他好文时间：2014-07-10 14:57:00 阅读次数：333

共13956条上一页 1 ... 1341 1342 1343 1344 1345 ... 1396 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)