关于Set集合它类似一个罐子,不能记住元素的添加顺序,它类似Collection,只是他不允许包含重复元素 去重复数据,我只需要把所有的数据都添加进Set,Set会自动把重复的数据去掉。如果把重复数据添加到Set中add方法会false,同时并不会添加进去。 (什么时候用Set呢? 去重复数据,我只 ...
分类:
编程语言 时间:
2016-10-12 00:32:15
阅读次数:
255
select s.* from ( select *, row_number() over (partition by PersonnelAccount order BY PersonnelID) as group_idx from AUX_SpecialPersonnel ) swhere s.g ...
分类:
数据库 时间:
2016-10-11 21:38:11
阅读次数:
212
id 姓名 课程名称 分数1 张三 数学 692 李四 数学 893 张三 数学 69删除除了自动编号不同,其他都相同的学生冗余信息 完整的sql语句如下:DELETE FROM tablename where id not in (select bid from (select min(id) a ...
分类:
数据库 时间:
2016-10-10 07:40:15
阅读次数:
253
算法10 二叉搜索树存在重复数据插入的实现 当用TREE-INSERT将n个具有相同关键字的数据项插入到一棵初始为空的二叉查找树中时,该算法的渐近性能如何? 我们可以对TREE-INSERT做一些改进,即在第5行的前面测试key[z] = key[x],在第11行的前面测试key[z] = key[ ...
分类:
编程语言 时间:
2016-09-23 19:50:34
阅读次数:
226
记载我的spark源码阅读火花知识点:1、seq:列表,适合存有序重复数据,进行快速插入/删除元素等场景,Set是集合,适合存无序非重复数据,进行快速查找海量元素等场景memoryKeys=Seq(
)2、private声明变量为私有privatevalhadoopConf=SparkHadoopUtil.get.newConfiguration(conf)..
分类:
其他好文 时间:
2016-09-23 15:19:24
阅读次数:
162
数据规整化:清理、转换、合并、重塑 1.合并数据集 pandas对象中的数据可以通过一些内置的方式进行合并: pandas.merge pandas.concat:沿一条轴线将多个对象进行堆叠 combine_first:重复数据连接,用一个对象中的值填充另一个缺失值 1.1 数据库风格的DataF ...
分类:
其他好文 时间:
2016-09-22 21:29:06
阅读次数:
501
一、常用统计函数 l COUNT() n 计算总记录条数-适用于所有字段 n COUNT(*) |-统计表中的所有记录条数 n COUNT(字段) |-统计该字段不为NULL的所有记录条数 n COUNT(DISTINCT(字段)) |-统计消除重复数据后的数据条数 l MAX() n 求最大值-适 ...
分类:
其他好文 时间:
2016-09-16 15:19:47
阅读次数:
206