1 概述
该瞅瞅MapReduce的内部运行原理了,以前只知道个皮毛,再不搞搞,不然怎么死的都不晓得。下文会以2.4版本中的WordCount这个经典例子作为分析的切入点,一步步来看里面到底是个什么情况。
2 为什么要使用MapReduce
Map/Reduce,是一种模式,适合解决并行计算的问题,比如TopN、贝叶斯分类等。注意,是并行计算,而非迭代计算,像涉及到层次聚类的问题就不...
分类:
其他好文 时间:
2014-07-12 21:31:22
阅读次数:
296
4.3 Map类
创建Map类和map函数,map函数是org.apache.hadoop.mapreduce.Mapper类中的定义的,当处理每一个键值对的时候,都要调用一次map方法,用户需要覆写此方法。此外还有setup方法和cleanup方法。map方法是当map任务开始运行的时候调用一次,cleanup方法是整个map任务结束的时候运行一次。
4.3.1 Map介绍
...
分类:
其他好文 时间:
2014-07-12 17:23:40
阅读次数:
262
(原创文章,转载请注明出处)
脚本以前限于行业应用,一直给我低效、低能的印象,但凡事总有个例外,我工作中用到了脚本语言。于是让我思索到底这个脚本在嵌入式系统上,特别是工业系统上,能有多大的作为?到底能走多远。...
分类:
其他好文 时间:
2014-07-12 17:23:07
阅读次数:
161
4.4 Reduce类
4.4.1 Reduce介绍
整完了Map,接下来就是Reduce了。YarnChild.main()—>ReduceTask.run()。ReduceTask.run方法开始和MapTask类似,包括initialize()初始化,根据情况看是否调用runJobCleanupTask(),runTaskCleanupTask()等。之后进入正式的工作,主要有这...
分类:
其他好文 时间:
2014-07-12 22:50:33
阅读次数:
185
ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)作为BI/DW(Business Intelligence)的核心和灵魂,能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。如果说数据仓库的模型设计是一座大厦的设计蓝图,数据是砖瓦的话,那么ETL就是建设大厦的过程。在整个项目中最难部分是用户需求...
分类:
其他好文 时间:
2014-07-12 21:46:17
阅读次数:
221
最近需求,需要用到4.6版本uGui了,所以抽时间来学习学习,就UI控件在Unity工具里创建预设这块来说相比较于NGUI,我觉得是没有什么太大的区别的。
比如:Canvas--Camera 、 Text--Label、ImageMask-- Panel 等。
可能是目前4.6版本还不稳定,其UI控件下所挂载的组件脚本代码我们是没法直接点击脚本看到更别说在代码里直接调出修改了,这点就目前来说确...
分类:
其他好文 时间:
2014-07-12 20:32:39
阅读次数:
391
题意:
已知每个点的加油站的油价单价(即点权),每条路的长度(边权)。
有q个询问,每个询问包括起点s、终点e和油箱容量。
问从起点走到终点的最小花费。如果不可达输出impossible,否则输出最小的旅途费用。
算法:
其实要分析状态= =感觉就像是dp。
最直接的想法是 每到一个点都加上要走到下一个点所需要的油量。但是走的路不同,到底怎么处理加多少的问题呢?
因...
分类:
其他好文 时间:
2014-07-12 18:19:04
阅读次数:
198
第四章——语句(上)
总结总结!!!
C没有布尔类型,所以在一些逻辑判断时候必须用整型表达式,零值为假,非零值为真。
for比while把控制循环的表达式收集起来放在一个地方,以便寻找。
do语句比while语句类似,但是前者能够保证循环体至少执行一次。
不要用goto。
switch...case...在没有加break时候多半有问题,我有一篇文章曾专门说这个事儿。
详情见http...
分类:
其他好文 时间:
2014-07-12 18:30:43
阅读次数:
135
HDU 4565 So Easy!
类似fib的构造
设Fn = x + y*sqrt(b)
啪啦啪啦
#include
#include
#include
#include
#include
using namespace std;
typedef vector vec;
typedef vector mat;
typedef long long ll;
ll a, b,...
分类:
其他好文 时间:
2014-07-12 21:34:01
阅读次数:
349
对于ORM框架而言,数据源的组织是一个非常重要的一部分,这直接影响到框架的性能问题。本文将通过对MyBatis框架的数据源结构进行详尽的分析,并且深入解析MyBatis的连接池。
本文首先会讲述MyBatis的数据源的分类,然后会介绍数据源是如何加载和使用的。紧接着将分类介绍UNPOOLED、POOLED和JNDI类型的数据源组织;期间我们会重点讲解POOLED类型的数据源和其实现的连接...
分类:
其他好文 时间:
2014-07-12 23:11:46
阅读次数:
650
Given a binary tree, determine if it is a valid binary search tree (BST).
Assume a BST is defined as follows:
The left subtree of a node contains only nodes with keys less than the node's key.Th...
分类:
其他好文 时间:
2014-07-12 17:26:31
阅读次数:
256
前文介绍了快速排序的单边扫描和双边扫描,但么有做对比,今天来简单分析下。一、单边扫描的缺点 单边扫描最大的缺点是每次都要交换,如果一个数组是 5 4 3 2 1,用单边扫描的话,则从4开始,4要和4交换一次,3要和3交换一次,依次类推,这种无意义的操作。正因此用双边扫描会更好,第一趟只需交换一次,就能得到1 4 3 2 5这样的数组。但双边扫描也是可以进一步优化的。二、双边扫描的优化 优化一:对k...
分类:
其他好文 时间:
2014-07-12 17:39:47
阅读次数:
181
做过ERP的技术人员,很清楚知道ERP多复杂,多难搞。
做过ERP的销售人员,很清楚知道ERP门槛低,专业强。
曾经我有幸进入专做ERP的科技公司,在这家企业我从一个java工程师一步步走上该ERP架构师,我很难想像那一年我是怎么过来的,几乎没有星期天,为了业务,专业和开发每天工作在15小时以上。
...
分类:
其他好文 时间:
2014-07-12 22:54:44
阅读次数:
235
可以看出,lib\armeabi占了大多数空间,so库不可能用到那么多把?WinHex打开:
明显是zip压缩文件,改后缀名后打开
apk文档!
finded!...
分类:
其他好文 时间:
2014-07-12 18:30:04
阅读次数:
260
桶排序
桶排序(Bucket Sort)是对基数排序的一个变种。在排序过程中没有用到计数数组,而是用不同的桶来暂时存储关键字。看一个示意图:
整个过程就是在不断地分配、收集。
在实际应用中,根据桶的创建策略,桶排序也有不同的写法。下面给出两种不同的桶创建方式。一、使用静态队列创建桶。二、使用二维数组模拟桶。...
分类:
其他好文 时间:
2014-07-12 21:48:07
阅读次数:
352