码迷,mamicode.com
首页 >  
搜索关键字:mapreduce 实战    ( 20951个结果
Hadoop集群维护
HDFS小文件问题及解决方案:http://dongxicheng.org/mapreduce/hdfs-small-files-solution/Hadoop升级方案(一):Hadoop 1.0内部版本升级(初稿):http://dongxicheng.org/mapreduce-nextgen/...
分类:其他好文   时间:2014-05-10 02:08:24    阅读次数:327
Hadoop下面WordCount运行详解
单词计数是最简单也是最能体现MapReduce思想的程序之一,可以称为MapReduce版"Hello World",该程序的完整代码可以在Hadoop安装包的"src/examples"目录下找到。单词计数主要完成功能是:统计一系列文本文件中每个单词出现的次数,如下图所示。现在我们以"hadoop...
分类:其他好文   时间:2014-05-10 01:54:48    阅读次数:445
从零开始编写自己的C#框架(5)——三层架构介绍
原文:从零开始编写自己的C#框架(5)——三层架构介绍 三层架构对于开发人员来说,已经是司空见惯了,除了大型与超小型项目外,大多都是这种架构来进行开发。 在这里为初学者们简单介绍一下三层架构: (下面内容摘自《趣味理解:三层架构与养猪—《.NET深入体验与实战精要》》,这是以前看到的关于三层架构介绍...
分类:其他好文   时间:2014-05-05 11:13:03    阅读次数:298
机器学习实战笔记一 k-近邻算法
属于离散监督,是一个简单的分类算法工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。k-...
分类:其他好文   时间:2014-05-04 20:00:18    阅读次数:388
SQL Server 大数据搬迁之文件组备份还原实战
原文:SQL Server 大数据搬迁之文件组备份还原实战一.本文所涉及的内容(Contents)本文所涉及的内容(Contents)背景(Contexts)解决方案(Solution)搬迁步骤(Procedure)搬迁脚本(SQL Codes)注意事项(Attention)疑问(Questions...
分类:数据库   时间:2014-05-04 19:06:55    阅读次数:751
类似web风格的 Winform 分页控件
背景 最近做一个Winform的小程序,需要用到分页,由于之前一直在用TonyPagerForWinForm.dll ,但该库没有源代码,网上找的也不全面,索性就准备自己改造一个。在园子里翻了一下,发现路过秋天在多年前写了个分页控件,Winform 通用分页控件实战篇(提供源码下载)。站在大神的肩....
分类:Windows程序   时间:2014-05-04 10:48:36    阅读次数:520
使用hadoop multipleOutputs对输出结果进行不一样的组织
MapReduce job中,可以使用FileInputFormat和FileOutputFormat来对输入路径和输出路径来进行设置。在输出目录中,框架自己会自动对输出文件进行命名和组织,如:part-(m|r)-00000之类。但有时为了后续流程的方便,我们常需要对输出结果进行一定的分类和组织。...
分类:其他好文   时间:2014-05-04 10:22:15    阅读次数:341
MapReduce 实现数据join操作
前段时间有一个业务需求,要在外网商品(TOPB2C)信息中加入联营自营识别的字段。但存在的一个问题是,商品信息和自营联营标示数据是两份数据;商品信息较大,是存放在hbase中。他们之前唯一的关联是url。所以考虑用url做key将两者做join,将联营自营标识信息加入的商品信息中,最终生成我需要的数...
分类:其他好文   时间:2014-05-04 10:02:22    阅读次数:565
LR实战之Discuz开源论坛——登录脚本
脚本业务流:访问Discuz论坛首页——登录论坛——退出论坛。本次使用LoadRunner11版本。一、录制脚本注意 1、确保Discuz论坛能在服务器运行正常。 2、录制前先试访问Discuz论坛注册一个测试用户。 3、选择录制协议,Discuz论坛是一个B/S架构的web论坛,使用常用协议“we...
分类:其他好文   时间:2014-05-03 22:45:38    阅读次数:533
Hadoop初学指南(7)--MapReduce自定义计数器
本文主要介绍了MapReduce中的自定义计数器的相关内容。在上次的单词统计例子中,我们可以看到MapReduce在执行过程中会有很多的控制台输出信息,其中有一个很关键的内容:计数器。如下图:可以看到最上方的关键字:Counters,这就表示计数器。在这里,只有一个制表符缩进的表示..
分类:其他好文   时间:2014-05-03 14:56:19    阅读次数:336
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!