码迷,mamicode.com
首页 >  
搜索关键字:mapreduce partitioner    ( 4100个结果
使用Python实现Hadoop MapReduce程序
转自:使用Python实现Hadoop MapReduce程序英文原文:Writing an Hadoop MapReduce Program in Python根据上面两篇文章,下面是我在自己的ubuntu上的运行过程。文字基本采用博文使用Python实现Hadoop MapReduce程序, 打...
分类:编程语言   时间:2014-06-19 06:01:59    阅读次数:366
Hadoop-2.2.0中文文档——MapReduce 下一代 -——集群配置
目的这份文档描写叙述了怎样安装、配置和管理从几个节点到有数千个节点的Hadoop集群。玩的话,你可能想先在单机上安装。(看单节点配置)。准备从Apache镜像上下载一个Hadoop的稳定版本号。安装安装一个Hadoop集群,一般包含分发软件到全部集群中的机器上或者是安装RPMs。一般地,集群中的一台...
分类:其他好文   时间:2014-06-19 00:19:50    阅读次数:372
使用 Apache Pig 处理数据5
使用 Apache Pig 从大数据集中获得所需的信息Apache Pig 是一个高级过程语言,适合于使用 Hadoop 和 MapReduce 平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 SQL 的查询,Pig 可以简化 Hadoop 的使用。本文将探索 Pig 背后的语言,并在...
分类:其他好文   时间:2014-06-18 23:59:12    阅读次数:305
使用 Apache Pig 处理数据7
Mapreduce 模式中的 Pig对于 MapReduce 模式,必须首先确保 Hadoop 正在运行。要做到这一点,最简单的方法是在 Hadoop 文件系统树的根上执行文件列表操作,如 清单 3 所示。清单 3. 测试 Hadoop 可用性$ hadoop dfs -ls /Found 3 it...
分类:其他好文   时间:2014-06-18 22:46:01    阅读次数:490
MapReduce全局变量之捉虫记
写MapReduce程序时候,有时候需要用到全局变量,常用的全局变量实现由三种方式:Configuration设置、DistributedCache、文件传参。博主在使用Configuration时,在Mapper中却没法读取全局变量。请看博主是如何一步一步找到问题所在的...
分类:其他好文   时间:2014-06-16 12:21:33    阅读次数:296
在Hadoop中重写FileInputFormat类以处理二进制格式存储的整数
近期開始使用MapReduce,发现网上大部分样例都是对文本数据进行处理的,也就是说在读取输入数据时直接使用默认的TextInputFormat进行处理就可以。对于文本数据处理,这个类还是能满足一部分应用场景。可是假设要处理以二进制形式结构化记录存储的文件时,这些类就不再适合了。本文以一个简单的应用...
分类:其他好文   时间:2014-06-16 06:14:38    阅读次数:297
MongoDB -- mapReduce
================= Incremental mapReduce =================...
分类:数据库   时间:2014-06-15 10:27:58    阅读次数:209
MapReduce——并行期望最大值化算法(EM在高斯混合分布中的应用)
并行期望最大值化算法(MapReduce)...
分类:其他好文   时间:2014-06-11 00:33:52    阅读次数:418
hadoop下实现kmeans算法——一个mapreduce的实现方法
hadoop上进行kmeans聚类,一次迭代只使用一个mapreduce...
分类:其他好文   时间:2014-06-10 14:01:32    阅读次数:236
MapReduce----并行支持向量机(PSVM)第二部分之原始对偶内点法
支持向量机的并行算法(MapReduce)...
分类:其他好文   时间:2014-06-08 03:51:35    阅读次数:272
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!