1. 希尔排序 思路: 是优化了的插入排序,可以改进当最值处于头或尾需要多次移动元素的问题,因为它会设置步长k(>=1),初始步长是len/2, 先保证步长为k的每个子数组有序,再进一步缩小步长直到为1的时候,数组基本有序。 ''' 希尔排序 时间复杂度 平均:O(nlogn) 最好:O(nlogn ...
分类:
编程语言 时间:
2021-04-29 11:58:13
阅读次数:
0
一、归并排序 要排序一个数组,先把数组从中间分成前后两部分,然后对前后两部分分别排序,再将排好序的两部分合并在一起。如下图: 重点: 归并排序使用的是分治思想。分治,就是分而治之,将一个大问题分解成小的子问题来解决。 分治思想跟递归思想很像,分治算法一般是用递归实现。 分治是一种解决问题的处理思想, ...
分类:
编程语言 时间:
2020-06-21 23:38:44
阅读次数:
74
为了防止二叉搜索树中性能大大降低的最坏情况出现,我们可以采用一些方法,如:随机化、分期化和最优化来使其达到平衡。 下面函数使用分区函数在线性时间内使一棵二叉搜索树达到完美平衡状态。我们先划分以便把中值节点放入树根,然后(递归地)对子树执行同样的操作。 1 void balanceR(link& h) ...
分类:
其他好文 时间:
2020-05-13 09:32:37
阅读次数:
45
问题:如果在 shuffle 的时候没有指定 reduce 的个数,那么会有多少个 reduce? 如果不指定 reduce 个数的话,就按默认的走: 1、如果自定义了分区函数 partitioner 的话,就按你的分区函数来走。 2、如果没有定义,那么如果设置了 spark.default.par ...
分类:
其他好文 时间:
2020-04-17 12:23:45
阅读次数:
70
目录RDD概述RDD实现RDD运行流程RDD分区RDD操作分类RDD编程接口说明一、RDD概述RDD:是Resilient distributed datasets的简称,中文为弹性分布式数据集;是Spark最核心的模块和类DAG:Spark将计算转换为一个有向无环图(DAG)的任务集合,通过为RD... ...
分类:
其他好文 时间:
2020-01-08 14:43:26
阅读次数:
102
语法 是一个Window函数,它为结果集的分区中的每一行分配一个连续的整数。 行号以每个分区中第一行的行号开头。 子句将结果集划分为分区。 函数分别应用于每个分区,并重新初始化每个分区的行号。 子句是可选的。如果未指定, 函数会将整个结果集视为单个分区。 子句定义结果集的每个分区中的行的逻辑顺序。 ...
分类:
其他好文 时间:
2019-07-30 18:41:08
阅读次数:
105
https://www.cnblogs.com/skying555/p/7903457.html 问题导读1.Kafka独特设计在什么地方?2.Kafka如何搭建及创建topic、发送消息、消费消息?3.如何书写Kafka程序?4.数据传输的事务定义有哪三种?5.Kafka判断一个节点是否活着有哪两 ...
分类:
其他好文 时间:
2019-05-17 13:44:43
阅读次数:
99
? 表分区是将一个表的数据按照一定的规则水平划分为不同的逻辑块,并分别进行物理存储,这个规则就叫做分区函数,可以有不同的分区规则 ? 通过show plugins语句查看当前MySQL是否支持表分区功能;5.7表分区功能默认开启; MySQL表分区介绍 ? 当表中含有主键或唯一键时,则每个被用作分区 ...
分类:
数据库 时间:
2019-03-18 16:55:10
阅读次数:
261
ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN DESC)函数的作用是指定COLUMN(列)进行分区,在分区内指定COLUMN(列)进行排序,其中PARTITION BY COLUMN 为分区函数。代码具体实现如下 不进行分区的排序方式-- ...
分类:
其他好文 时间:
2019-02-01 18:53:06
阅读次数:
175
我们都知道,SQL server2008R2企业版以及一些其它的版本支持分区函数,当你在这些数据库备份后想在一些不支持分区函数的数据库做还原时,就会失败。 下面我们来解决这个问题。 1.备份数据库!备份数据库!备份数据库! (对数据库动任何刀子前先备份) 2.删除分区函数所涉及的表,因为在建表的时候 ...
分类:
数据库 时间:
2019-01-11 11:25:29
阅读次数:
725