码迷,mamicode.com
首页 >  
搜索关键字:hadoop yarn搭建    ( 13956个结果
分布式-ubuntu12.04上安装hadoop1.2.1
在hadoop1.2.1的安装说明中有说明要预先安装java,我安装了好多版本的java以及好多版本的hadoop,然后发现oracle-java7与hadoop1.2.1是可以匹配的。 一,安装具体步骤如下: 1. 安装java: sudo apt-get install oracle-java7-installer 2. 安装hadoop1.2.1: http://hadoop....
分类:其他好文   时间:2014-07-11 00:31:01    阅读次数:265
Hadoop常见异常及其解决方案
1、Shell$ExitCodeException 现象:运行hadoop job时出现如下异常: 14/07/09 14:42:50 INFO mapreduce.Job: Task Id : attempt_1404886826875_0007_m_000000_1, Status : FAILED Exception from container-launch: org.apache....
分类:其他好文   时间:2014-07-11 00:24:58    阅读次数:355
Cannot lock storage /tmp/hadoop-root/dfs/name. The directory is already locked.
ERROR namenode.NameNode: java.io.IOException: Cannot lock storage /tmp/hadoop-root/dfs/name. The directory is already locked....
分类:其他好文   时间:2014-07-11 00:23:43    阅读次数:362
在执行生成Hfile的MR任务的时候出现client端的OOM
在执行MR将HDFS转换为HFile的时候,出现了如下异常: 14/07/09 18:02:59 INFO mapred.JobClient:  map 83% reduce 0% 14/07/09 18:02:59 INFO mapred.JobClient: Task Id : attempt_201401091245_59030413_m_000001_0, Status : FAILE...
分类:其他好文   时间:2014-07-10 23:32:44    阅读次数:323
Spark SQL with Hive
Spark1.1发布后会支持Spark SQL CLI , Spark SQL的CLI会要求被连接到一个Hive Thrift Server上,来实现类似hive shell的功能。...
分类:数据库   时间:2014-07-10 21:14:38    阅读次数:737
Hadoop2.4.1入门实例:MaxTemperature
一、前期准备 1、创建伪分布Hadoop环境,请参考官方文档。 2、准备数据文件如下sample.txt: 12345679867623119010123456798676231190101234567986762311901012345679867623119010123456+001212345678903456 123456798676231190101234567986762311...
分类:其他好文   时间:2014-07-10 19:41:45    阅读次数:479
2.HDFS操作
1.使用命令行操作1)4个通用命令行<1>archive归档文件的创建用途:由于hadoop的设计是为了处理大数据,理想的数据应该blocksize的倍数。namenode在启动时会将所有的元数据load到内存中当大量小于blocksize的文件存在的时候,,不仅占用了大量的存储空间,也占用了大量的n..
分类:其他好文   时间:2014-07-10 18:56:21    阅读次数:353
hadoop版本变迁
最近在研究hadoop时,发现hadoop的版本很混乱。原来的版本都说0.X.X开始,后来发现有1.X.X和2.X.X 这样就不太清楚了。 0.20.2版本以前(不含该版本)的配置文件都在default.xml中。 0.20.x以后的版本不含有eclipse插件的jar包,由于eclipse的版本不一,所以就需要自己编译源码生成对应的插件。 0.20.2——0.22.x版本的配置文件集...
分类:其他好文   时间:2014-07-10 17:43:44    阅读次数:211
Spark上对SequenceFile的支持
本文介绍了spark对hadoop sequencefile的读写支持,实现方式以及简单的使用方法。sequencefile和textfile类似,在上下文里有直接提供读取方法,但最终走的还是hadoopFile方法。...
分类:其他好文   时间:2014-07-10 17:11:52    阅读次数:951
Hadoop 项目及结构
现在 Hadoop 已经发展成为包含多个子项目的集合。虽然其核心内容是 MapReduce 和Hadoop 分布式文件系统(HDFS),但 Hadoop 下的Common 、Avro、 Chukwa、Hive 、HBase等子项目也是不可或缺的。它们提供了互补性服务或在核心层上提供了更高层的服务。以...
分类:其他好文   时间:2014-07-10 14:57:00    阅读次数:333
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!