搜索关键字：mapreduce partitioner，搜索到4100个结果！码迷,mamicode.com！

海量推荐系统：mapreduce的方法

1. Motivation2. MapReduceMapReduce是一种数据密集型并行计算框架。待处理数据以“块”为单位存储在集群机器文件系统中（HDFS），并以(key, value)的键值对形式保存。当任务启动时，系统将计算任务分配给存储数据的相应机器。MapReduce计算任务可以划分为两个...

分类：其他好文时间：2014-07-28 15:16:13 阅读次数：202

Hadoop学习笔记(5) ——编写HelloWorld(2)

Hadoop学习笔记(5) ——编写HelloWorld(2) 前面我们写了一个Hadoop程序，并让它跑起来了。但想想不对啊，Hadoop不是有两块功能么，DFS和MapReduce。没错，上一节我们写了一个MapReduce的HelloWorld程序，那这一节，我们就也学一学DFS程序的编写。....

分类：其他好文时间：2014-07-27 22:24:49 阅读次数：280

mongodb mapreduce使用总结

mongodb mapreduce使用总结...

分类：数据库时间：2014-07-26 02:43:46 阅读次数：349

MongoDB：Map-Reduce

Map-reduce是一个考虑大型数据得到有用聚集结果的数据处理程式（paradigm）．针对map-reduce操作，MongoDB提供来mapreduce命令．...

分类：数据库时间：2014-07-25 11:09:11 阅读次数：275

MapReduce中Map数量的控制

InputFormat这个类是用来处理Map的输入数据的，任务开始时，InputFormat先将HDFS里所有输入文件里的数据分割成逻辑上的InputSpilt对象这里的split是HDFS中block的部分或者一整块或几个快中的数据的逻辑分割，一个split对应于一个Map，所以Map的数量是由split的数量决定的。那么怎样去确定InputSpilt的个数呢，下面列出于split个...

分类：其他好文时间：2014-07-25 11:03:11 阅读次数：204

大数据技术

Hadoop MapReduce思维模式转变的催化剂是大量新技术的诞生，它们能够处理大数据分析所带来的3个V的挑战。扎根于开源社区，Hadoop已经是目前大数据平台中应用率最高的技术，特别是针对诸如文本、社交媒体订阅以及视频等非结构化数据。除分布式文件系统之外，伴随Hadoop一同出现的还有进行大数...

分类：其他好文时间：2014-07-24 17:00:47 阅读次数：263

hadoop应用开发技术详解

《大数据技术丛书：Hadoop应用开发技术详解》共12章。第1～2章详细地介绍了Hadoop的生态系统、关键技术以及安装和配置；第3章是 MapReduce的使用入门，让读者了解整个开发过程；第4～5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O；第6章分析了 MapReduce的工...

分类：其他好文时间：2014-07-24 11:25:42 阅读次数：337

在hadoop上进行编写mapreduce程序，统计关键词在text出现次数

mapreduce的处理过程分为2个阶段，map阶段，和reduce阶段。在要求统计指定文件中的所有单词的出现次数时， map阶段把每个关键词写到一行上以逗号进行分隔，并初始化数量为1（相同的单词hadoop中的map会自动放到一行中） reduce阶段是把每个单词出现的频率统计出来重新写回去。如代码： package com.clq.hadoop2; import org.apa...

分类：其他好文时间：2014-07-23 17:16:02 阅读次数：199

hadoop 8088 看不到mapreduce 任务的执行状态

进到8088页面后，怎么看不到mapreudce的执行状态，有哪里需要配置的解决办法：在$HADOOP_HOME/conf/mapred-site.xml 在原来的配置文件基础之上添加： mapreduce.framework.name yarn mapre...

分类：其他好文时间：2014-07-22 22:36:15 阅读次数：211

利用QJM实现HDFS的HA策略部署与验证工作记录分享

1、概述Hadoop2.X中的HDFS(Vsersion2.0)相比于Hadoop1.X增加了两个重要功能，HA和Federation。HA解决了Hadoop1.XNamenode中一直存在的单点故障问题，HA策略通过热备的方式为主NameNode提供一个备用者，并且这个备用者的状态一直和主Namenode的元数据保持一致，一旦主NameNode挂..

分类：其他好文时间：2014-07-22 14:55:35 阅读次数：365

共4100条上一页 1 ... 388 389 390 391 392 ... 410 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)