直接上sql:方法一: 问题:一张route表。现在需要删除,payment_type=0 ,并且point_start 和point_end相同的重复数据,示例如下: id为19,267的数据重复。20,268,269数据重复。需要保留id为19和20的。其他重复数据删除。 方法二: 两种方法都能 ...
分类:
数据库 时间:
2018-05-15 20:56:58
阅读次数:
196
转自:http://www.maomao365.com/?p=4942**row_number函数在数据库中的功能是为每一行按照一定的规则生成一个编号,我们常常利用这一属性,对表进行分页操作,下文我们将讲述采用row_number函数删除表中重复数据行**/*建表*/createtableA(keyIdint,infovarchar(200))go/*生成数据*/insertintoA(keyId
分类:
数据库 时间:
2018-05-11 12:42:08
阅读次数:
188
我看了下感觉这公司貌似挺不错的,面试官人也挺好的,氛围应该很不错,可惜我实力不足,唉,接续努力,下面把面试中印象较深的三个问题写一下。 面试问题1:数据库删除重复数据,多条重复的数据中只保留一条 表名 t 如果a字段的数据每行都不同的话SQL如下:( 保留a字段数据最小的那条,如果要保留大的就讲mi ...
分类:
编程语言 时间:
2018-05-10 01:05:43
阅读次数:
203
1、调用聚合函数 sum:返回所有值的和/非重复数据的和 avg:平均数且忽略空值 min:最小值 max:最大值 count:计数函数 distinct:去不重复记录 2、数学函数 abs:绝对值 power:乘方 。例如:power(2,2):2的2次方 rand:随机浮点数,随机取0-1之间的 ...
分类:
数据库 时间:
2018-05-06 20:03:46
阅读次数:
175
Jmeter中使用CSV Data Set Config参数化不重复数据执行N遍 要求: 今天要测试上千条数据,且每条数据要求执行多次,(模拟多用户多次抽奖) 1.用户id有175个,且没有任何排序规则; 2.要求175个用户都去请求,每个用户执行3次; (由于自己笔记本性能不佳,只能数量小举例,大 ...
分类:
其他好文 时间:
2018-05-04 23:19:35
阅读次数:
196
在MySQL教程|菜鸟教程系统复习的时候有一些知识点还没掌握透的或者思维方式还没完全跟上的地方,写了一个笔记,讲道理此笔记对除我之外的任何读者不具有任何实用价值,只针对我在复习MySQL基础过程中的查漏补缺。 MySQL查询: MySQL不支持全连接,所以用左连接+union+右连接实现完全连接。 ...
分类:
数据库 时间:
2018-04-22 21:49:05
阅读次数:
234
判断重复数据的判断方法:df.duplicated(),该方法中两个主要的参数是subset和keep: subset:要判断重复值的列,可以指定特定列或多个列。默认使用全部列。 keep:当重复时不标记为True的规则,可设置为第一个、最后一个和全部标记为True(False)。默认为第一个,即第 ...
分类:
其他好文 时间:
2018-04-20 22:03:34
阅读次数:
157
基础概念 类别不均衡是指在分类学习算法中,不同类别样本的比例相差悬殊,它会对算法的学习过程造成重大的干扰。比如在一个二分类的问题上,有1000个样本,其中5个正样本,995个负样本,在这种情况下,算法只需将所有的样本预测为负样本,那么它的精度也可以达到99.5%,虽然结果的精度很高,但它依然没有价值 ...
分类:
其他好文 时间:
2018-04-20 00:19:17
阅读次数:
456
数据质量分析 脏数据包括:缺失值;异常值;不一致的值;重复数据及含有特殊符号的数据; 1.缺失值处理 统计缺失率,缺失数 2.异常值处理 (1)简单统计量分析 (2)3Q原则 正态分布情况下,小概率事件为异常值 不服从正太分布的,可以用原离平均值多少倍标准差来分析 (3)箱线图分析 使用descri ...
分类:
编程语言 时间:
2018-04-19 15:02:38
阅读次数:
171
有人提出要将4张表合并成一张。数据量比较大,有4千万条数据。有很多重复数据,需要对某一列进行去重。 思路: 1、导出数据。select into outfile。 2、传输到要导入数据的服务器上。 3、创建一张新表,主键和约束等与那三张表一样。 4、LOAD DATA INFILE导入。利用repl ...
分类:
数据库 时间:
2018-04-16 16:22:58
阅读次数:
228