1.基于树模型提取特征 2.基于L1,L2惩罚值提取特征 3.递归特征消除法提取特征 4.互信息选择法提取特征 5.利用相关系数选择特征 6.卡方检验法提取特征 7.利用方差选择特征 参考:https://www.kesci.com/ ...
分类:
其他好文 时间:
2019-07-09 00:28:36
阅读次数:
371
机器学习是时下流行AI技术中一个很重要的方向,无论是有监督学习还是无监督学习都使用各种“度量”来得到不同样本数据的差异度或者不同样本数据的相似度。良好的“度量”可以显著提高算法的分类或预测的准确率,本文中将介绍机器学习中各种“度 ...
分类:
其他好文 时间:
2019-06-15 20:07:28
阅读次数:
98
FUNCTION 相关系数 code SVM code III CNN main FUNCTION convolution FUNCTION convolution_f1 FUNCTION CNN_upweight FUNCTION init_kernel FUNCTION pooling view ...
分类:
其他好文 时间:
2019-05-23 15:53:11
阅读次数:
115
本文翻译自文章:Pandas Cheat Sheet - Python for Data Science 对于数据科学家,无论是数据分析还是数据挖掘来说,Pandas是一个非常重要的Python包。它不仅提供了很多方法,使得数据处理非常简单,同时在数据处理速度上也做了很多优化,使得和Python内置 ...
分类:
其他好文 时间:
2019-05-12 10:53:27
阅读次数:
219
一、连续变量与连续变量的相关分析 > 用相关分析 相关分析是指连续变量之间的一种非严格的相依赖的变化关系,具体表现为:当一个变量发生时,另一个变量随之发生相应线性变动的关系,我们一般可以用相关系数 r 大小来衡量两个连续变量的相关性强弱(注意:不是衡量因果关系),例如衡量客户入网时长和每月话费的相关 ...
分类:
其他好文 时间:
2019-04-13 21:45:43
阅读次数:
176
一、np.var 数学上学过方差: $$D(X)=\sum_{i\in [0,n)} ({x \bar{x}})^2 $$ np.var实际上是均方差。 函数原型: 计算张量a在axis轴上的方差 a:一个ndarray,不一定是一维 axis:可取值为None,int,int元组。当取值为None ...
分类:
其他好文 时间:
2019-04-12 00:45:13
阅读次数:
1172
3.1 数据预处理 数据质量的三个要素:准确性、完整性和一致性。 3.1.2 数据预处理的主要任务 数据清理:填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性来”清理“数据。 数据集成:相关性分析,卡方,协方差,相关系数 数据归约:大->小,维归约,数据压小 数据变换和数据离散化:规范化 ...
分类:
其他好文 时间:
2019-04-06 22:47:56
阅读次数:
253
[TOC] 近期广泛阅读券商关于 宏观高频数据 的研报,发现了两点不足: 就研究手段而言,比较粗放,普遍停留在仅仅比较数据相关系数的层面; 就理论高度而言,很少探讨数据背后的因果关联。 不过有些理念先进的券商团队已经开始从 产业链传导 的角度试图细致的描述数据间的关联,这正好契合了下面这篇文章的核心 ...
分类:
其他好文 时间:
2019-02-26 00:57:43
阅读次数:
173
参考:《 "深度学习500问" 》 期望 ?在概率论和统计学中,数学期望(或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和。它反映随机变量平均取值的大小。 线性运算: $E(ax+by+c) = aE(x)+bE(y)+c$ ?推广形式: $E(\sum_{k=1}^{n}{a_ix_ ...
分类:
其他好文 时间:
2019-01-26 00:20:33
阅读次数:
296
https://zhidao.baidu.com/question/526371815.html ...
分类:
其他好文 时间:
2019-01-18 23:59:09
阅读次数:
379