码迷,mamicode.com
首页 >  
搜索关键字:mahout hadoop canopy 聚类 大数据    ( 26726个结果
hadoop2.0 配置yarn成功
很久不写 BO-KE 了,来一篇吧,记住这个成功的一刻,把几个主要文件贴出来: core-site.xml:               fs.defaultFS          hdfs://fc20:9000                      hadoop.tmp.dir          /home/ljq/hadoop/tm...
分类:其他好文   时间:2014-05-09 00:35:27    阅读次数:342
hbase0.96数据导入以及Kettle操作hbase问题
版本:cdh5.0.0+hadoop2.3.0+hbase0.96.1.1+Spoon5.0.1一、HBase数据导入HBase数据导入使用org.apache.hadoop.hbase.mapreduce.ImportTsv 的两种方式,一种是直接导入,一种是转换为HFile,然后再次导入。1. HDFS数据为(部分):[root@node33 data]# hadoop fs -ls /inp...
分类:其他好文   时间:2014-05-09 00:25:48    阅读次数:515
Hadoop全分布模式操作
http://blog.csdn.net/wangloveall/article/details/20767161摘要:介绍Hadoop全分布模式操作,实现真正意义上的集群架构。关键词:Hadoop 全分布模式 文件配置利用Hadoop解决大数据问题时,我们是用全分布模式来操作Hadoop。如何基于...
分类:其他好文   时间:2014-05-08 23:44:04    阅读次数:354
Hadoop之HDFS
摘要:HDFS是Hadoop的核心模块之一,围绕HDFS是什么、HDFS的设计思想和HDFS的体系结构三方面来介绍。关键词:Hadoop HDFS 分布式存储系统HDFS是Hadoop的核心模块之一,HDFS是什么?它是Hadoop分布式文件系统(Hadoop Distributed File S....
分类:其他好文   时间:2014-05-08 23:38:42    阅读次数:412
Hadoop伪分布模式操作
http://blog.csdn.net/wangloveall/article/details/20195813摘要:本文介绍Hadoop伪分布模式操作,适合于Hadoop学习、开发和调试。关键词:Hadoop 伪分布式 文件配置启动Hadoop支持三种模式操作,分别是单机模式操作、伪分布模式.....
分类:其他好文   时间:2014-05-08 23:37:12    阅读次数:419
【原】centos6.5下hadoop cdh4.6 安装
1、架构准备: namenode 10.0.0.2 secondnamenode 10.0.0.3 datanode1 10.0.0.4 datanode2 10.0.0.6 datanode3 10.0.0.112、安装用户:cloud-user3、[namenode]namenod...
分类:其他好文   时间:2014-05-08 23:27:27    阅读次数:693
Hadoop生态系统
摘要:介绍Hadoop生态系统,从Hadoop生态系统有什么成员,成员能做什么和Hadoop生态系统能够提供大数据问题解决方案两方面来认识。关键词:Hadoop HDFS MapReduce HBase Hive PigHadoop生态图,通俗地说,就是Hadoop核心模块和衍生的子项目。一幅Ha....
分类:其他好文   时间:2014-05-08 23:16:24    阅读次数:387
Hadoop之MapReduce
http://blog.csdn.net/wangloveall/article/details/21407531摘要:MapReduce是Hadoop的又一核心模块,从MapReduce是什么,MapReduce能做什么以及MapReduce的工作机制三方面认识MapReduce。关键词:Hado...
分类:其他好文   时间:2014-05-08 23:03:55    阅读次数:270
hadoop知识点记录
浅谈在shell脚本中使用HQL访问hive
分类:其他好文   时间:2014-05-08 22:57:09    阅读次数:262
JobTracker启动流程源码级分析
org.apache.hadoop.mapred.JobTracker类是个独立的进程,有自己的main函数。JobTracker是在网络环境中提交及运行MR任务的核心位置。 main方法主要代码有两句:1 //创建jobTracker对象2 JobTracker t...
分类:其他好文   时间:2014-05-08 22:51:48    阅读次数:368
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!