摘要:Hadoop之MapReduce程序包括三个部分:Mapper,Reducer和作业执行。本文介绍和分析MapReduce程序三部分结构。...
分类:
其他好文 时间:
2014-06-20 12:32:07
阅读次数:
197
hadoop上进行kmeans聚类,一次迭代只使用一个mapreduce...
分类:
其他好文 时间:
2014-06-10 14:01:32
阅读次数:
236
Hbase简介
Hbase 全称是Hadoop DataBase ,是一种开源的,可伸缩的,高可靠,高性能,面向列的分布式存储系统。
类似于Google的BigTable,其分布式计算采用MapReduce,通过MapReduce完成大块数据加载和全表扫描操作。文件存储系统是HDFS,通过Zookeeper来完成状态管理协同服务。不过BigTable只支持一级索引,而Hbase支持一级和二级索...
分类:
其他好文 时间:
2014-06-08 18:24:32
阅读次数:
563
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
namespace mapReduce
{
public static class helper
{
public static Dictionary MapReduce(
...
分类:
其他好文 时间:
2014-06-08 10:39:41
阅读次数:
227
摘要:MapReduce程序开发流程遵循算法思路、Mapper、Reducer、作业执行的步骤。...
分类:
其他好文 时间:
2014-06-07 13:42:08
阅读次数:
242
XML 解析器通常是高性能、健壮应用程序的关键。传统的 XML
解析技术包括文档对象模型(Document Object Model,DOM)和 Simple API for XML (SAX)。现在有一种非常不错的名为
Streaming API for XML (StAX) 的创新型新解析技术,...
分类:
其他好文 时间:
2014-06-05 14:27:08
阅读次数:
383
Hadoop是云计算的事实标准软件框架,是云计算理念、机制和商业化的具体实现,是整个云计算技术学习中公认的核心和最具有价值内容。如何从企业级开发实战的角度开始,在实际企业级动手操作中深入浅出并循序渐进的掌握Hadoop是本课程的核心。云计算学习者的心声:如何从企业级开发的角度,不断动手实际操作,循序...
分类:
其他好文 时间:
2014-06-05 14:25:48
阅读次数:
300
一:课程简介:
Hadoop是云计算分布式大数据的事实标准软件框架,Hadoop中的架构实现是整个云计算产业技术的基础,作为与Google三大核心技术DFS、MapReduce、BigTable相对的HDFS、MapReduce、和HBase也是整个Hadoop生态系统的核心的技术,本课程致力于帮您...
分类:
其他好文 时间:
2014-06-05 14:17:33
阅读次数:
273