solve A B C D E F G H I J K L 5/12 ac ac ac ac ac try A - Super-palindrome 题意 : 一个字符串,每个子串都要是回文的,问你最少翻几个。 如果每一个字符串都是回文串,那么最终奇数位等于奇数位,偶数位等于偶数位, #includ ...
分类:
其他好文 时间:
2020-04-09 00:38:31
阅读次数:
101
共性: 1、都是spark平台下的分布式弹性数据集 2、都有惰性机制,创建、转换如map操作时不会立即执行,遇到foreach等Action算子时才开始运算。 3、都会自动缓存计算 4、都有partition概念 区别: 1、RDD不支持sparkSQL操作 2、DF每一行类型固定为Row,只有通过 ...
分类:
其他好文 时间:
2020-04-08 21:03:30
阅读次数:
292
一致性的重要性 分布式领域CAP理论告诉我们,任何一个分布式系统都无法同时满足Consistency(一致性),Availability(可用性), Partition tolerance(分区容错性) 这三个基本需求。最多只能满足其中两项。 但是,一个分布式系统无论在CAP三者之间如何权衡,都无法 ...
分类:
其他好文 时间:
2020-04-08 19:01:42
阅读次数:
54
此博客链接:https://www.cnblogs.com/ping2yingshi/p/12656345.html 将数组分成和相等的三个部分(43min) 题目链接:https://leetcode-cn.com/problems/partition-array-into-three-parts ...
分类:
编程语言 时间:
2020-04-07 22:29:58
阅读次数:
124
数据仓库建设中的数据抽取环节,常常需要增量抽取业务库数据。但业务库数据不是一层不变的,会根据时间发生状态变更,那么就需要同步更新变化数据到HIVE中。过去在Oracle上做数据仓库时,可以使用merge的方法合并新老数据。但hive中没有该功能,本文旨在通过sqoop抽取后,自动实现数据合并。 表设 ...
分类:
数据库 时间:
2020-04-07 18:32:57
阅读次数:
99
题意: 给一个数字n 求离n最近(且不等)的回文串 存在多个答案返回最小的 首先很容易想到 将数字分为两段,如 12345 -> 123/45,然后将后半段根据前面的进行镜像重置 123/45 -> 12321 那,如果数字刚好是回文串,就把前半段-1就好了 但是存在以下例外,就是当前半段 +1 或 ...
分类:
其他好文 时间:
2020-04-06 15:59:20
阅读次数:
64
/** *重置kafka消费进度 *参数中需要指定kafka集群中一台broker地址,要重置的topic名称,消费组,以及partition个数 */public static void seekLatest(String broker, String topic, String group, i ...
分类:
其他好文 时间:
2020-04-03 18:28:01
阅读次数:
109
[TOC] 算法 时间复杂度 算法的时间复杂度是一个函数,它定量描述了该算法的运行时间,时间复杂度常用“O”表述,使用这种方式时,时间复杂度可被称为是渐近的,它考察当输入值大小趋近无穷时的情况 时间复杂度小结: 时间复杂度是用来估计算法运行时间的一个式子(单位) 一般来说,时间复杂度高的算法比复杂度 ...
分类:
编程语言 时间:
2020-04-02 18:16:04
阅读次数:
76
MySQL分区表概述 随着MySQL越来越流行,Mysql里面的保存的数据也越来越大。在日常的工作中,我们经常遇到一张表里面保存了上亿甚至过十亿的记录。这些表里面保存了大量的历史记录。 对于这些历史数据的清理是一个非常头疼事情,由于所有的数据都一个普通的表里。所以只能是启用一个或多个带where条件 ...
分类:
其他好文 时间:
2020-03-31 17:12:59
阅读次数:
78