搜索关键字：hadoop zookeeper，搜索到18907个结果！码迷,mamicode.com！

Hadoop之词频统计小实验（基于单节点伪分布）

声明：1）本文由我bitpeach原创撰写，转载时请注明出处，侵权必究。 2）本小实验工作环境为Ubuntu操作系统，hadoop1-2-1，jdk1.8.0。 3）统计词频工作在单节点的伪分布上，至于真正实际集群的配置操作还没有达到，希望能够由本文抛砖引玉。（一）Hadoop的配置修正网上有很多...

分类：其他好文时间：2014-05-05 21:54:47 阅读次数：456

Mahout安装

在Hadoop集群环境下安装Mahout。环境：OS：Centos 6.5 x64 & Soft：Hadoop 1.2.1 & Mahout 0.91、简介mahout项目主页：https://mahout.apache.org/下载二进制包，上传到服务器。2、安装用集群环境用户安装，解压二进制包。...

分类：其他好文时间：2014-05-05 21:35:23 阅读次数：429

Mahout学习

Mahout小案例学习，实现k-means算法。环境：OS：Centos 6.5 x64 & Soft：Hadoop 1.2.1 & Mahout 0.91、下载测试数据[huser@master hadoop]$ wget http://archive.ics.uci.edu/ml/databas...

分类：其他好文时间：2014-05-04 12:34:58 阅读次数：340

Hadoop MRUnit使用（一）

之前在写MR job的时候，由于要在云梯，或者一淘的开发集群上运行；所以处理方法是，在本地打成jar包，然后scp到客户端网关机上，然后在提交job运行。这样的问题时，有时候如果遇到一些逻辑上的问题，job跑挂了。必须在本地修改程序，然后重新打包，scp，再运行，这样比较麻烦；询问了一圈，觉得采用M...

分类：其他好文时间：2014-05-04 10:54:29 阅读次数：427

ubuntu下hadoop环境配置

软件环境：虚拟机：VMware Workstation 10 操作系统：ubuntu-12.04-desktop-amd64 JAVA版本：jdk-7u55-linux-x64 Hadoop版本：hadoop-1.2.1 Hadoop下载地址：http://mirrors.cnnic.cn/apa...

分类：其他好文时间：2014-05-04 10:43:51 阅读次数：370

使用hadoop multipleOutputs对输出结果进行不一样的组织

MapReduce job中,可以使用FileInputFormat和FileOutputFormat来对输入路径和输出路径来进行设置。在输出目录中，框架自己会自动对输出文件进行命名和组织，如:part-(m|r)-00000之类。但有时为了后续流程的方便，我们常需要对输出结果进行一定的分类和组织。...

分类：其他好文时间：2014-05-04 10:22:15 阅读次数：341

利用JavaAPI访问HDFS的文件

利用JavaAPI访问HDFS的文件 1、重读配置文件core-site.xml要利用Java客户端来存取HDFS上的文件，不得不说的是配置文件hadoop-0.20.2/conf/core-site.xml了，最初我就是在这里吃了大亏，所以我死活连不上HDFS，文件无法创建、读取。hadoop.t...

分类：编程语言时间：2014-05-03 22:10:40 阅读次数：300

高效5步走，快速搭建Hadoop2伪分布环境

前两天将Hadoop2的完全分布式搭建文档整理发布于网上（http://blog.csdn.net/aaronhadoop/article/details/24859369），朋友相邀，就再将Hadoop2的伪分布式文档整理一下，搭建过Hadoop2完全分布式后，就笑对“伪分布式”说声呵呵吧。前期的jdk环境、SSH免密钥登录配置在此就不再赘述了，直接进入hadoop2的配...

分类：其他好文时间：2014-05-03 21:51:45 阅读次数：344

ZooKeeper做独立服务器运行(下)

ZooKeeper做独立服务器运行(下)作者：chszs，转载需注明。博客主页：http://blog.csdn.net/chszs四、ZooKeeper Java客户端连接后的命令概述键入help，可以看到有如下命令： connecthost:port getpath [watch] lspath [watch] setpat...

分类：其他好文时间：2014-05-03 21:45:58 阅读次数：274

hadoop无法启动

dataNode 无法启动是配置过程中最常见的问题，主要原因是多次format namenode 造成namenode 和datanode的clusterID不一致。建议查看datanode上面的log信息。解决办法:修改每一个datanode上面的CID(位于dfs/data/current/VERSION文件夹中)使两者一致。...

分类：其他好文时间：2014-05-03 21:37:44 阅读次数：308

共18907条上一页 1 ... 1884 1885 1886 1887 1888 ... 1891 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)