码迷,mamicode.com
首页 >  
搜索关键字:大数据集    ( 238个结果
转】MapReduce: Simplified Data Processing(一)
摘要MapReduce是一个编程模型,和处理,产生大数据集的相关实现.用户指定一个map函数处理一个key/value对,从而产生中间的key/value对集.然后再指定一个reduce函数合并所有的具有相同中间key的中间value.下面将列举许多可以用这个模型来表示的现实世界的工作.以这种方式写...
分类:其他好文   时间:2014-06-29 00:17:14    阅读次数:369
使用 Apache Pig 处理数据5
使用 Apache Pig 从大数据集中获得所需的信息Apache Pig 是一个高级过程语言,适合于使用 Hadoop 和 MapReduce 平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 SQL 的查询,Pig 可以简化 Hadoop 的使用。本文将探索 Pig 背后的语言,并在...
分类:其他好文   时间:2014-06-18 23:59:12    阅读次数:305
hadoop数据去重
"数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。1.1 实例描述 对数据文件中的数据进行去重。数据文件中的每行都是一个数据。 样例输入如下.....
分类:其他好文   时间:2014-06-16 13:22:07    阅读次数:309
用Map-Reduce的思维处理数据
Map-reduce是一种优雅的数据处理方式,本文通过三个例子介绍如何用python在linux的管道进行map-reduce编程,本文写的所有map-reduce程序都可以原封不动的放在Hadoop下运行,很容易在大数据集上扩展。
分类:其他好文   时间:2014-06-09 19:11:44    阅读次数:253
hadoop学习;大数据集在HDFS中存为单个文件;安装linux下eclipse出错解决;查看.class文件插件
一个典型的hadoop工作流会在别的地方...
分类:系统相关   时间:2014-05-15 03:47:41    阅读次数:422
MapReduce入门实例
Hadoop集群(第9期)_MapReduce初级案例1、数据去重 "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。1.1 实例描述 对数.....
分类:其他好文   时间:2014-05-11 16:02:24    阅读次数:538
Hadoop集群(第9期)_MapReduce初级案例 - 虾皮 - 博客园
Hadoop集群(第9期)_MapReduce初级案例 - 虾皮 - 博客园1、数据去重 "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。1....
分类:其他好文   时间:2014-05-08 20:38:16    阅读次数:669
localForage——轻松实现 Web 离线存储
localStorage 能够让你实现基本的数据存储,但它的速度慢,而且不能处理二进制数据。IndexedDB 和 WebSQL 是异步的,速度快,支持大数据集,但他们的API 使用起来有点复杂。不仅如此,IndexedDB 和 WebSQL 没有被所有的主流的浏览器厂商支持,这种情况最近也不太.....
分类:Web程序   时间:2014-04-30 01:39:26    阅读次数:660
238条   上一页 1 ... 22 23 24
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!