码迷,mamicode.com
首页 >  
搜索关键字:hadoop 2.2    ( 13955个结果
Hadoop 分布式环境搭建
Hadoop 分布式环境搭建一、前期环境安装概览IPHost NameSoftwareNode192.168.23.128ae01JDK 1.7NameNode, SecondaryNameNode, DataNode,JobTracker, TaskTracker192.168.23.129ae0...
分类:其他好文   时间:2014-06-16 07:43:06    阅读次数:214
在Hadoop中重写FileInputFormat类以处理二进制格式存储的整数
近期開始使用MapReduce,发现网上大部分样例都是对文本数据进行处理的,也就是说在读取输入数据时直接使用默认的TextInputFormat进行处理就可以。对于文本数据处理,这个类还是能满足一部分应用场景。可是假设要处理以二进制形式结构化记录存储的文件时,这些类就不再适合了。本文以一个简单的应用...
分类:其他好文   时间:2014-06-16 06:14:38    阅读次数:297
apache的hadoop升级到CDH hadoop2.0时遇到的问题及解决
1:引入的jar包1.X版本有hadoop-core包;而2.x没有如果你需要hdfs就引入\share\hadoop\common\lib +hadoop-common-2.0.0-cdh4.6.0.jar +hadoop-hdfs-2.0.0-cdh4.6.0.jar +\share\hadoo...
分类:其他好文   时间:2014-06-12 13:59:33    阅读次数:255
Hadoop实例练习(二)
实例描述:现有两个文件,dedu1.txt和dedu2.txt,数据文件中的每一行都是一个数据,现要对这两个文件进行去重,两个文件内容分别为(同颜色的表示重复的数据):dedu1.txt:dedu2.txt:2012-3-1a2012-3-1b2012-3-2b2012-3-2a2012-3-3c2012-3-3b2012-3-4d2012-3-4d2012-3-5a2012..
分类:其他好文   时间:2014-06-10 22:21:15    阅读次数:208
Ubuntu 12.04下Hadoop 2.2.0 集群搭建(原创)
现在大家可以跟我一起来实现Ubuntu 12.04下Hadoop 2.2.0 集群搭建,在这里我使用了两台服务器,一台作为master即namenode主机,另一台作为slave即datanode主机,增加更多的slave只需重复slave部分的内容即可。系统版本:master:Ubuntu 12....
分类:其他好文   时间:2014-06-10 22:01:07    阅读次数:423
Eclipse 导入 Hadoop 源码
1.准备工作jdk:eclipse:Maven:libprotoc :https://developers.google.com/protocol-buffers/hadoop:http://www.apache.org/dyn/closer.cgi/hadoop/common/添加开源中国mave...
分类:系统相关   时间:2014-06-10 17:07:37    阅读次数:356
hadoop下实现kmeans算法——一个mapreduce的实现方法
hadoop上进行kmeans聚类,一次迭代只使用一个mapreduce...
分类:其他好文   时间:2014-06-10 14:01:32    阅读次数:236
HDFS使用
1HDFS概述HDFS是Hadoop应用用到的一个最主要的分布式存储系统。一个HDFS集群主要由一个NameNode和很多个Datanode组成:Namenode管理文件系统的元数据,而Datanode存储 了实际的数据。本文档主要关注用户以及管理员怎样和HDFS进行交互。基本上,客户端联系Name...
分类:其他好文   时间:2014-06-10 12:40:13    阅读次数:275
分布式Hadoop安装
本文旨在介绍通过两台物理节点,实现完全分布式hadoop程序的安装部署。
分类:其他好文   时间:2014-06-10 10:13:49    阅读次数:313
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!