搜索关键字：mapreduce，搜索到4054个结果！码迷,mamicode.com！

Hadoop专业解决方案-第3章：MapReduce处理数据

Hadoop的核心处理模块是MapReduce，也是当前最流行的大数据处理架构之一。它能够将Hadoop数据存储无缝的融入到数据处理当中，使得它在操作上足够简单，功能上足够强大。MapReduce已经解决很多实际问题（从日志分析，到数据排序，到文本操作，到基于模式的搜索，到图像处理，到机器学习等等）...

分类：其他好文时间：2014-05-27 00:14:28 阅读次数：449

MapReduce job在JobTracker初始化源码级分析

mapreduce job提交流程源码级分析（三）中已经说明用户最终调用JobTracker.submitJob方法来向JobTracker提交作业。而这个方法的核心提交方法是JobTracker.addJob(JobID jobId, JobInProgress job)方法，这个addJob.....

分类：其他好文时间：2014-05-26 23:20:49 阅读次数：354

MongoDB 聚合之 MapReduce

理解 MapReduce。

分类：数据库时间：2014-05-26 12:23:25 阅读次数：296

Mahout kmeans聚类

K-means算法是最为经典的基于划分的聚类方法，是十大经典数据挖掘算法之一。K-means算法的基本思想是：以空间中k个点为中心进行聚类，对最靠近他们的对象归类。通过迭代的方法，逐次更新各聚类中心的值，直至得到最好的聚类结果。Mahout kmeans MapReduce实现的原理和上述的一致，值得注意的是，Mahout将数据存储在HDFS，用MapReduce做批量并行的计算。在做kmeans之前，需要将文本用Mahout向量化模块工具做向量化。计算过程主要分为三个步骤：初始中心选取，寻找簇中心，划分数...

分类：其他好文时间：2014-05-26 06:00:31 阅读次数：239

hadoop学习；block数据块；mapreduce实现例子；UnsupportedClassVersionError异常；关联项目源码

对于开源的东东，尤其是刚出来不久，我觉得最好的学习方式就是可以看源码和doc，测试它的例子为了方便查看源码，关联导入源码的项目 block数据块，在配置文件hdfs-default.xml中可以查看到,记住要修改不是在这里 block文件存储块是最基本的单位查看block存放位置，配置文件中查看如果文件大于64M会占两个块，meta文件是校验...

分类：其他好文时间：2014-05-26 05:30:58 阅读次数：227

MapReduce Kmeans聚类算法

最近在网上查看用MapReduce实现的Kmeans算法，例子是不错，http://blog.csdn.net/jshayzf/article/details/22739063但注释太少了，而且参数太多，如果新手学习的话不太好理解。所以自己按照个人的理解写了一个简单的例子并添加了详细的注释。大致的步...

分类：其他好文时间：2014-05-24 10:41:01 阅读次数：315

Hive 自定义函数（转）

Hive是一种构建在Hadoop上的数据仓库，Hive把SQL查询转换为一系列在Hadoop集群中运行的MapReduce作业，是MapReduce更高层次的抽象，不用编写具体的MapReduce方法。Hive将数据组织为表，这就使得HDFS上的数据有了结构，元数据即表的模式，都存储在名为meta....

分类：其他好文时间：2014-05-23 05:54:55 阅读次数：1771

2.1 Hadoop Eclipse Plugin 配置及安装

Hadoop Eclipse 开发工具主要分为1、根据Hadoop版本生成插件2、安装Hadoop Eclipse插件3、配置Hadoop目录4、配置Hadoop连接5、新一个MapReduce工程WordCount.javaMapReduce——WordCount问题总结参考：http://bl...

分类：系统相关时间：2014-05-23 02:44:30 阅读次数：354

MapReduce 气象数据集

通过MapReduce程序分析气象数据集，更好的了解计算过程。环境：Hadoop 1.2.1 & Centos 6.5 x641、气象数据集准备下载链接：ftp://ftp3.ncdc.noaa.gov/pub/data完整数据集非常大，可以下载部分数据集作为日常实验数据。2、气象数据上传到HDFS...

分类：其他好文时间：2014-05-22 15:39:14 阅读次数：361

【教程分享】基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析

基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析课程讲师：迪伦课程分类：Java 适合人群：高级课时数量：96课时用到技术：MapReduce、HDFS、Map-Reduce、Hive、Sqoop 涉及项目：Greenplum Hadoop大数据分析平台更新程度：完毕对这个课程有兴趣的朋友可以加我的QQ2059055336和...

分类：其他好文时间：2014-05-21 13:23:22 阅读次数：363

共4054条上一页 1 ... 397 398 399 400 401 ... 406 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)