码迷,mamicode.com
首页 >  
搜索关键字:namenode hadoop    ( 14338个结果
Linux下SSH免密码登录(转)
搭建hadoop集群的时候一定会用到的就是SSH免密码登录[hadoop@hadoop1 ~]$ ssh-keygen -t rsaGenerating public/private rsa key pair.Enter file in which to save the key (/home/ha...
分类:系统相关   时间:2014-05-09 23:10:11    阅读次数:471
VMware 下扩展linux硬盘空间
很多人在学习Nutch、Hadoop或者熟悉Linux操作系统时都会选择在VMWare上安装Linux虚拟机,而又往往不想分配给Linux虚拟机足够大的硬盘空间,这就容易导致使用Linux一段时间后,发现虚拟机上的硬盘空间不够了,此时怎么解决?有的人直接选择了重新安装Linux虚拟机,但是下一次硬盘又不够了呢,还要重新安装操作系统吗,那再下一次呢?这种方法势必会进入一个重复无聊的过程,除了增加安装...
分类:系统相关   时间:2014-05-09 21:52:40    阅读次数:526
数据挖掘:概念与技术(原书第3版) 电子书 PDF 下载 制作 定制 服务
Hadoop大数据处理
分类:其他好文   时间:2014-05-09 15:42:46    阅读次数:315
【原】centos6.5下cdh4.6 Oozie安装
0、oozie只需安装在一台服务器上,这里选择在namenode上来安装;安装用户为cloud-user1、安装Oozie包: sudo yum install -y oozie oozie-client2、对于yarn来说,需要修改/etc/oozie/conf/oozie-env.sh中: CA...
分类:其他好文   时间:2014-05-09 15:42:15    阅读次数:580
【原】Centos6.5下cdh4.6 hive安装部署
1、前提条件: 只需要选择一台服务器即可,这里选择安装在namenode上;安装用户为cloud-user2、安装包: sudo yum install -y hive hive-metastore hive-server23、安装mysql: sudo yum install -y mysq...
分类:其他好文   时间:2014-05-09 15:38:16    阅读次数:512
Hadoop-2.2.0中文文档—— MapReduce 下一代--容量调度器
目的 这份文档描述 CapacityScheduler,一个为Hadoop能允许多用户安全地共享一个大集群的插件式调度器,如他们的应用能适时被分配限制的容量。 概述 CapacityScheduler 被设计成以分享的、多用户集群运行 Hadoop 应用并最大化利用集群的机制。 传统上,每一个组织都会有它自己的私有电脑资源,在顶峰或接近顶峰状态有充足的容量来面对组织的SLA...
分类:其他好文   时间:2014-05-09 13:59:54    阅读次数:424
ODPS 下map / reduce 的编写
接到阿里电话说实习和竞赛智能二选一, 真伤心, 在实习前发挥余热吧.      总结一下在ODPS下 编写map / reduce 和进行购买预测的过程.      首先这里的hadoop输入输出都是表的形式, 我们需要一张输入表和一张输出表.    输入表为 提供的 t_alibaba_bigdata_user_brand_total_1  输出表为自定义的wc_out    w...
分类:其他好文   时间:2014-05-09 02:33:28    阅读次数:418
Spork: Pig on Spark实现分析
介绍 Spork是Pig on Spark的highly experimental版本,依赖的版本也比较久,如之前文章里所说,目前我把Spork维护在自己的github上:flare-spork。 本文分析的是Spork的实现方式和具体内容。 Spark Launcher 在hadoop executionengine包路径下,写了一个Spark启动器,同MapReduceLauncher类似,会在launchPig的时候,把传入的物理执行计划进行翻译。 MR启动器翻译的是MR的操作,以及进一步的MR...
分类:其他好文   时间:2014-05-09 02:08:17    阅读次数:358
大数据之hadoop,国内首部:Zookeeper从入门到精通课程分享
对这个课程感兴趣的朋友可以加我QQ2059055336和我联系。ZooKeeper是Hadoop的开源子项目(GoogleChubby的开源实现),它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、命名服务、分布式同步、组服务等。Zookeeper的FastFail和Leader选举特性大大增强了分..
分类:其他好文   时间:2014-05-09 00:54:51    阅读次数:265
hive0.13安装
1.COPY配置文件:cphive-default.xml.templatehive-site.xmlcphive-env.sh.templatehive-env.shcphive-exec-log4j.properties.templatehive-exec-log4j.propertiescphive-log4j.properties.templatehive-log4j.properties2.配置HADOOP主目录:vimhive-env.shHADOOP_HOME=/usr/a..
分类:其他好文   时间:2014-05-09 00:51:29    阅读次数:282
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!