int cmp(const void* a,const void* b){ return *(int*)a-*(int*)b; } double trimMean(int* arr, int arrSize){ qsort(arr,arrSize,sizeof(int),cmp); int num= ...
分类:
编程语言 时间:
2020-11-10 10:28:59
阅读次数:
9
k折验证中k值对偏差和方差的影响? 总共n个数据,假设为2,每次训练集大小为n/2,每次训练的数据量会偏小,取平均值后,由于每次训练的数据量比较小,最终学习输出的模型会不能很好的代表样本的分布(欠拟合),换句话说就是偏差大。或者这么理解,由于k折交叉验证是使用k次训练的结果取平均值来进行预测的,如果 ...
分类:
其他好文 时间:
2020-11-08 17:06:28
阅读次数:
20
是否值得付费?Oracle,OpenJDK等四大JVM性能全面对比导读:随着Java11的发布,OracleJDK成为收费软件,很多公司转向寻找OracleJDK的替代品。有很多人都会怀疑,OracleJDK和其他JDK之间有没有很大的性能差异,本文作者通过多方面测试,给出这个问题的答案,适合Java程序员研读。市面上可供选择的JVM发行版还是有不少的。选择合适的JVM需要考虑不同的因素。性能是其
分类:
数据库 时间:
2020-11-06 01:04:25
阅读次数:
20
PCA是用来给多维数据降维,分析提取主成分的一种算法; 怎么实现的呢?首先说明,在已标注和未标注的数据上都有降维技术,PCA是一种在对未标注数据的降维技术。 在PCA中,数据从原来的坐标系转换到了新的坐标系,新坐标系的选择是由数据本身决定的。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐 ...
分类:
其他好文 时间:
2020-11-04 19:25:03
阅读次数:
44
字符串函数 concat(s1, s2...sn) 字符串 s1, s2 等多个字符串合并为一个字符串 insert(s1, x, len, s2) 字符串 s2 替换 s1 的 x 位置开始长度为 len 的字符串 lower(s) 将字符串 s 的所有字母变成小写字母 upper(s) 将字符串 ...
分类:
数据库 时间:
2020-10-24 10:20:53
阅读次数:
34
误差来源 bias variance 比喻:打靶 真实的Function$\widehat$ 通过训练集得到的最优解$f^*$ $f^*\(是\)\widehat$的一个估计 $\widehat$就是靶心,我们打靶的目标 $f^*$是打靶的结果,与靶心的距离即为误差 假设要估计变量$x$的均值$\m ...
分类:
其他好文 时间:
2020-10-13 17:51:44
阅读次数:
42
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。例如,[2,3,4] 的中位数是 3[2,3] 的中位数是 (2 + 3) / 2 = 2.5设计一个支持以下两种 ...
分类:
其他好文 时间:
2020-10-08 19:40:02
阅读次数:
16
对表进行聚合查询 聚合函数 通过 SQL 对数据进行某种操作或计算时需要使用函数。 常用函数 COUNT: 计算表中的记录数(行数) SUM: 计算表中数值列中数据的合计值 AVG: 计算表中数值列中数据的平均值 MAX: 求出表中任意列中数据的最大值 MIN: 求出表中任意列中数据的最小值 用于汇 ...
分类:
数据库 时间:
2020-10-05 22:20:49
阅读次数:
41
在缺失值填补上如果用前后的均值填补中间的均值,比如,0,空,1,我们希望中间填充0.5;或者0,空,空,1,我们希望中间填充0.33,0.67这样。 可以用pandas的函数进行填充,因为这个就是线性插值法 df..interpolate() dd=pd.DataFrame(data=[0,np.n ...
分类:
编程语言 时间:
2020-09-24 21:23:08
阅读次数:
47
常见的数据标准化方法有以下6种: 1、Min-Max标准化 Min-Max标准化是指对原始数据进行线性变换,将值映射到[0,1]之间 2、Z-Score标准化 Z-Score(也叫Standard Score,标准分数)标准化是指:基于原始数据的均值(mean)和标准差(standard devia ...
分类:
其他好文 时间:
2020-09-23 23:26:39
阅读次数:
62