冒泡排序算法: 第一次排序依次比较相邻的两个数,第n个数与n+1个数比较,n大则n和n+1交换,否则继续比较n+1与n+2........最后最大的数会沉底。 第二次排序。。。。。。。。。。次大的数会沉底 第n躺后排序完成。 冒泡排序算法:bubbleSort 方法调用 结果如上图。时间复杂度n^2 ...
分类:
编程语言 时间:
2017-09-15 02:09:53
阅读次数:
165
二次排序工具类: 测试数据: 1 43 44 64 94 186 65 98 98 94 6 ...
分类:
编程语言 时间:
2017-08-31 16:14:45
阅读次数:
141
前言: 根据前面的几篇博客学习,现在可以进行MapReduce学习了。本篇博客首先阐述了MapReduce的概念及使用原理,其次直接从五个实验中实践学习(单词计数,二次排序,计数器,join,分布式缓存)。 一 概述 定义 MapReduce是一种计算模型,简单的说就是将大批量的工作(数据)分解(M ...
分类:
编程语言 时间:
2017-08-04 21:30:22
阅读次数:
869
Design T-Shirt Problem Description Soon after he decided to design a T-shirt for our Algorithm Board on Free-City BBS, XKA found that he was trapped b ...
分类:
编程语言 时间:
2017-07-15 16:47:34
阅读次数:
191
本人在研究Spak,最近看了很多网上的对于SPARK用Java实现二次排序的方法,对于自定义key的做法基本上都是实现Ordered<>接口,重写$greater、$greater$eq、$less、$less$eq、compare、compareTo方法,定义hashCode、equals·····感觉好麻烦,其实我们自定义key只是用..
分类:
编程语言 时间:
2017-04-28 12:01:49
阅读次数:
1000
一:TopN的书写编码 1.先上传数据 2.程序 3.结果 4.注意点 Spark中不支持二次排序,如果想实现二次排序,需要根据业务的执行逻辑使用两阶段聚合来进行操作 二:优化 1.两阶段聚合 ...
分类:
其他好文 时间:
2017-02-14 20:28:19
阅读次数:
2073
不多说,直接上代码。 2016-12-12 17:04:32,012 INFO [org.apache.hadoop.metrics.jvm.JvmMetrics] - Initializing JVM Metrics with processName=JobTracker, sessionId=2 ...
分类:
编程语言 时间:
2016-12-12 19:21:22
阅读次数:
277
写这篇文章,是因为最近遇到了mapreduce的二次排序问题。以前的理解不完全正确。首先看一下mapreduce的过程 相信这张图熟悉MR的人都应该见过,再来一张图 wordcount也不细说了,hadoop里面的hello,world 之前我的理解是map过来的<k,v>会形成(k,<v1,v2, ...
分类:
其他好文 时间:
2016-11-18 17:56:29
阅读次数:
222
先贴一张原理图(摘自hadoop权威指南第三版) 实际中看了半天还是不太理解其中的Partition,和reduce端的二次排序,最终根据实验来结果来验证自己的理解 1eg 数据如下 2014010114 标识20140101日的温度为14度,需求为统计每年温度的最最高值 2014010114 20 ...
分类:
编程语言 时间:
2016-11-03 15:59:30
阅读次数:
287
一、对于二次排序案例部分理解 二、二次排序示例代码 三、MapReduce join简单理解 四、MapReduce join代码示例 ...
分类:
编程语言 时间:
2016-10-28 19:42:39
阅读次数:
223