码迷,mamicode.com
首页 >  
搜索关键字:map-reduce    ( 649个结果
ceilometer的map_reduce机制
Map/Reduce是一个聚合工具。比如SQL和mongodb的group(by),countdistinct等都是聚合命令。 Map/Reduce其实是一个分布式计算的思想的实现的软件框架。就是你遵循这个框架的规范,编写上层代码可以实现你的分布式计算,并能把所有计算结果聚合到一起得到最终一个简单的结果。基于Map/reduce写出来的应用能运行在上千台服务器组成的集群上,并以一种可靠的容错...
分类:其他好文   时间:2014-12-11 12:29:12    阅读次数:271
MongoDB与CouchDB全方位对比(转)
出处:http://www.csdn.net/article/2011-03-21/294226本文见于MongoDB官方网站,MongoDB与CouchDB很相似,他们都是文档型存储,数据存储格式都是JSON型的,都使用Javascript进行操作,都支持Map/Reduce。但是其实二者有着很多...
分类:数据库   时间:2014-12-11 11:59:10    阅读次数:253
Hadoop 中SequenceFile的简介
概念 SequenceFile是一个由二进制序列化过的key/value的字节流组成的文本存储文件,它可以在map/reduce过程中的input/output 的format时被使用。在map/reduce过程中,map处理文件的临时输出就是使用SequenceFile处理过的。 所以一般的SequenceFile均是在FileSystem中生成,供map调用的原始文件。 ...
分类:其他好文   时间:2014-12-10 22:48:16    阅读次数:280
Alex 的 Hadoop 菜鸟教程: 第10课 Hive 入门教程
Hive是什么 Hive 提供了一个让大家可以使用sql去查询数据的途径。但是最好不要拿Hive进行实时的查询。因为Hive的实现原理是把sql语句转化为多个Map Reduce任务所以Hive非常慢,官方文档说Hive 适用于高延时性的场景而且很费资源。 举个简单的例子 metastore...
分类:其他好文   时间:2014-12-08 19:39:48    阅读次数:368
Mapreduce 学习
以WordCount为例在类WordCount中实现两个内部静态类(Map,Reduce)1、Mappublic static class Map extends MapReduceBase implements Mapper { private final static IntWritabl...
分类:其他好文   时间:2014-11-24 11:23:39    阅读次数:236
Python中常用内置函数介绍(filter,map,reduce,apply,zip)
Python是一门很简洁,很优雅的语言,其很多内置函数结合起来使用,可以使用很少的代码来实现很多复杂的功能,如果同样的功能要让C/C++/Java来实现的话,可能会很头大,其实Python是将复杂的数据结构隐藏在内置函数中,你只要写出自己的业务逻辑,Python会自动得出你想要的结果。这方面的内置函数主要有,filter,map,reduce,apply,结合匿名函数,列表解析一起使用,功能更加强大....
分类:移动开发   时间:2014-11-17 14:07:29    阅读次数:269
hadoop/storm以及hive/hbase/pig区别整理
STORM与HADOOP的比较对于一堆时刻在增长的数据,如果要统计,可以采取什么方法呢?等数据增长到一定程度的时候,跑一个统计程序进行统计。适用于实时性要求不高的场景。如将数据导到HDFS,再运行一个MAP REDUCE JOB。如果实时性要求高的,上面的方法就不行了。因此就带来第二种方法。在数据每...
分类:其他好文   时间:2014-11-16 21:24:49    阅读次数:223
mongodb Map/reduce测试代码
private void AccountInfo() { ls.Clear(); DateTime dt = DateTime.Now.Date; IMongoQuery query = Query.GTE(p =>...
分类:数据库   时间:2014-11-14 17:34:42    阅读次数:238
流式 storm介绍
Storm是什么 如果只用一句话来描述storm的话,可能会是这样:分布式实时计算系统。按照storm作者的说法,storm对于实时计算的意义类似于hadoop对于批处理的意义。我们都知道,根据google mapreduce来实现的hadoop为我们提供了map, reduce原语,使我们的批处理...
分类:其他好文   时间:2014-11-12 19:31:07    阅读次数:260
Google的分布式计算模型Map Reduce map函数将输入分割成key/value对
http://www.nowamagic.net/librarys/veda/detail/1768上一篇大规模分布式数据处理平台Hadoop的介绍中提到了Google的分布式计算模型Map Reduce,这里再单独拿出来了解一下。并行计算简介计算机的早期阶段,程序都是serial(连续的),类似于...
分类:其他好文   时间:2014-11-09 11:07:45    阅读次数:227
649条   上一页 1 ... 55 56 57 58 59 ... 65 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!