SELECT * FROM [dbo].[I_Friend] T1WHERE NOT EXISTS(SELECT 1 FROM [dbo].[I_Friend] T2 WHERE T1.UserId=T2.FriendUserId AND T1.FriendUserId=T2.UserId AND ...
分类:
数据库 时间:
2020-06-30 11:16:26
阅读次数:
66
如上问题,报了java.lang.IllegalArgumentException 这个错 解决办法: 以上是导出javadoc出现的报错,是因为于环境变量中CLASS_PATH冲突,jdk1.8是不需要配置classpath的,删去,重启黑窗口或者idea 即可正常生成javadoc ...
分类:
编程语言 时间:
2020-06-27 19:59:06
阅读次数:
76
simhash是google用来处理海量文本去重的算法。 google出品,你懂的。 simhash最牛逼的一点就是将一个文档,最后转换成一个64位的字节,暂且称之为特征字,然后判断重复只需要判断他们的特征字的距离是不是 原理 simhash值的生成图解如下: 大概花三分钟看懂这个图就差不多怎么实现 ...
分类:
其他好文 时间:
2020-06-27 16:07:33
阅读次数:
63
之前如果想使用flatten,一般借助于numpy.ndarray.flatten。 但是 flatten只能适用于numpy对象,即array或者mat,普通的list列表不适用。 最近找到一个轻便的办法如下: from itertools import chain # flatten print ...
分类:
编程语言 时间:
2020-06-27 09:34:09
阅读次数:
74
a = frame.drop_duplicates(subset=['pop'],keep='first') #保留重复数据的第一个 b = frame.drop_duplicates(subset=['pop'],keep=False) #去掉重复的数据 ...
分类:
其他好文 时间:
2020-06-26 16:06:44
阅读次数:
40
题面 其实从题目的标题当中我们已经可以得到很多信息了,实际上也的确如此,这题的题面和标题八九不离十,需要我们对一个有序的数组进行去重。不过去重的条件是最多允许一个元素出现两次,也就是要将多余的元素去掉。并且题目还限制了需要我们在原数组进行操作,对于空间复杂度的要求是。由于我们去除了元素之后会带来数组 ...
分类:
编程语言 时间:
2020-06-26 14:52:56
阅读次数:
54
题目描述: 编写代码,移除未排序链表中的重复节点。保留最开始出现的节点。 进阶要求:如果不得使用临时缓冲区,该怎么解决? 今日学习: 1.链表和数组的相互转换 2.巩固链表概念 题解: 1.我的想法:链表存进Set去重,Set转成数组再转成链表 2.利用Set不重复特性,遍历链表,Set中有val就 ...
分类:
其他好文 时间:
2020-06-26 14:23:36
阅读次数:
49
又是一个美妙的算法 定义 重儿子:在一个点 \(x\) 的子节点中,拥有最大子树的儿子 \(y\) 是 \(x\) 的重儿子。 轻儿子:在一个点 \(x\) 的子节点中,除去重儿子的子节点为 \(x\) 的轻儿子。 重边:父亲与重儿子的连边。 轻边:父亲与轻儿子的连边。 重链:只由重边构成的链。 我 ...
分类:
其他好文 时间:
2020-06-25 21:07:59
阅读次数:
35
端到端一致性: exactly-once传输过程要保证exactly-once, 需要内部能够实现状态保存, 当下游保存失败时, 能够更加保存的历史状态再次提交数据.而下游接受数据, 需要具备去重能力. 去重有两种方式:幂等写入, 事务写入内部: 支持checkpoint或者状态保存下一级: 数据不... ...
分类:
其他好文 时间:
2020-06-25 19:15:36
阅读次数:
119
复习 # str # upper lower # startswith endswith # s = 'Python世界' # print(s.upper()) # print(s.lower()) # print(s.startswith('P')) # print(s.endswith('界') ...
分类:
编程语言 时间:
2020-06-24 21:45:17
阅读次数:
58