码迷,mamicode.com
首页 >  
搜索关键字:reduce    ( 2830个结果
MapReduce实现排序功能
期间遇到了无法转value的值为int型,我采用try catch解决 str2 2 str1 1 str3 3 str1 4 str4 7 str2 5 str3 9 用的\t隔开,得到结果  str1 1,4  str2 2,5 str3 3,9 str4 7 我这里map,reduce都是单独出来的类,用了自定义的key package com.kan...
分类:其他好文   时间:2014-06-05 06:52:38    阅读次数:353
浅谈hadoop中mapreduce的文件分发
DistributedCache 是一个提供给Map/Reduce框架的工具,用来缓存文件(text, archives, jars and so on)...
分类:其他好文   时间:2014-06-03 02:18:37    阅读次数:332
Mahout 模糊kmeans
FCM 算法用一个Job寻找cluster的中心点。在map的初始化节点,加载初始化(或上一轮迭代的结果)中心点。在map中计算point 和每一个簇的亲和度。在combiner计算同一个cluster的参数,该过程只能计算同一cluster的局部信息。在reduce中首先计算同一个cluster的全局参数,然后计算该cluster是否收敛,输出cluster。...
分类:其他好文   时间:2014-05-26 04:12:39    阅读次数:302
python实现阶乘阶乘--reduce函数
h=lambda t:(reduce(lambda x,y:x*y,range(1,t+1))) h(5)=120 reduce函数是一个二元操作函数,他用来将一个数据集合(链表,元组等)中的所有数据进行下列操作:用传给reduce中的函数 func()(必须是一个二元操作函数)先对集合中的第1,2个数据进行操作,得到的结果再与第三个数据用func()函数运算,最后得到一个结果。...
分类:编程语言   时间:2014-05-25 09:55:21    阅读次数:477
paip.提升效率---filter map reduce 的java 函数式编程实现
#paip.提升效率---filter map reduce 的java 函数式编程实现========================================================#----------------------index索引------------------++...
分类:编程语言   时间:2014-05-23 06:44:58    阅读次数:431
PageRank算法简介及Map-Reduce实现
本文总结PageRank的原理,并提供了一种Python版本的Map-Reduce计算方法
分类:其他好文   时间:2014-05-23 06:23:31    阅读次数:515
2.2 Hadoop Studio 使用 [Hadoop学习笔记]
Hadoop Studio 是一个 map-reduce 结构的集成开发环境,基于NetBeans。你可以利用它来方便快速的创建基于Hadoop的 map-reduce 应用。该工具提供了一个实时的map-reduce任务的工作流视图,可以显示任务之间独立的输入输出和交互,而且该视图在代码修改时会实...
分类:其他好文   时间:2014-05-22 15:06:10    阅读次数:302
MapReduce之浅析Map接口和Reduce接口
import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.ap...
分类:其他好文   时间:2014-05-22 01:11:55    阅读次数:337
【教程分享】基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析
基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析  课程讲师:迪伦  课程分类:Java  适合人群:高级  课时数量:96课时  用到技术:MapReduce、HDFS、Map-Reduce、Hive、Sqoop  涉及项目:Greenplum Hadoop大数据分析平台  更新程度:完毕 对这个课程有兴趣的朋友可以加我的QQ2059055336和...
分类:其他好文   时间:2014-05-21 13:23:22    阅读次数:363
MapReduce入门
说明MapReduce是一种分布式计算模型,解决海量数据的计算问题,主要有Map和Reduce组成用户使用时需要实现map()和reduce()两个函数,两个函数的形参都是key/value键值对若以eclipse为开发环境,运行时出现内存不足的情况,需要修改虚拟机的参数 (例如把Default V...
分类:其他好文   时间:2014-05-19 11:56:18    阅读次数:352
2830条   上一页 1 ... 279 280 281 282 283 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!