1、去掉取值变化小的特征。 如某个特征取值为0,1,在样本中存在95%的取值为1,那么这个特征的作用不大 2、单变量特征的选择。 Pearson相关系数:权衡的是变量之间的线性相关性。它要求两个变量的变化是单调的,如y1=x和y2=x^2,Pearson系数为0,但其实两者并不是独立的。取值方位为: ...
分类:
其他好文 时间:
2017-05-02 17:24:41
阅读次数:
287
SLNum=iris(:,1); SWNum=iris(:,2); PLNum=iris(:,3); PWNum=iris(:,4); Num=[SLNum,SWNum,PLNum,PWNum]; coeff1=corr(SLNum,SWNum,'type','Spearman'); coeff2= ...
分类:
其他好文 时间:
2017-04-16 21:11:21
阅读次数:
226
变量:连续变量、有序分类变量 和 无序分类变量 一、连续变量和连续变量 1、若连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,就是效率没有pearson相关系数高。 2、若连续数据不满足正态分布,可采用对数转换等方法将数据转换成正态分布。 3、上 ...
分类:
其他好文 时间:
2017-02-15 22:09:55
阅读次数:
453
mean均值,variance方差,stddev标准差,corr(Pearson相关系数),skewness偏度,kurtosis峰度 ...
分类:
其他好文 时间:
2016-11-25 20:00:48
阅读次数:
153
先说独立与相关的关系:对于两个随机变量,独立一定不相关,不相关不一定独立。有这么一种直观的解释(不一定非常准确):独立代表两个随机变量之间没有任何关系,而相关仅仅是指二者之间没有线性关系,所以不难推出以上结论。 衡量随机变量相关性的方法主要有三种:pearson相关系数,spearman相关系数,k ...
分类:
其他好文 时间:
2016-09-30 02:26:33
阅读次数:
206
1.重要的统计量 2.协方差 3.Pearson相关系数 4.协方差矩阵 5.相关系数矩阵 用来发现特征的相关性 6.独立与不相关 7.矩 8.重要的定理与不等式 ①Jenson不等式 ②切比雪夫不等式 ③大数定理 ④伯努利定理 ⑤中心极限定理 9.参数估计 ①矩估计 ②极大似然估计 ...
分类:
其他好文 时间:
2016-07-19 22:09:45
阅读次数:
118
网络的连通性 网络的连通性对信息传播(传播速度、扩散规模)有较大影响。 度相关性:一条边连接的两个节点度值之间的相关性(一般使用度值的Pearson相关系数来刻画) 度大节点趋于和度大节点相连,则该网络为同配的 度大节点趋于和度小节点相连,则该网络为异配的 对于无标度网络,网络中的度相关性会影响谣言 ...
分类:
其他好文 时间:
2016-06-05 16:58:18
阅读次数:
171
Pearson相关系数考察两个事物(在数据里我们称之为变量)之间的相关程度,简单来说就是衡量两个数据集合是否在一条线上面。其计算公式为: 或或N表示变量取值的个数。相关系数r的值介于–1与+1之间,即–1≤r≤+1。其性质如下:当r>0时,表示两变量(当X的值增大(减小),Y值增大(减小))正相关,...
分类:
其他好文 时间:
2016-01-01 11:04:01
阅读次数:
1837
主要从普通的相关性和空间的自相关性分析。普通的相关性如变量之间的相关性,特别是目标变量与因子变量之间的相关性分析,本身也是预处理中特征选择的重要方法;而空间的相关性分析则分析则相关性,其中空间关联是其显著的特点;时间序列之间也存在空间相关性,对其进行探索性分析可考察空间数据(栅格)的时间联动性。1普通相关性分析就是分析变量之间的相关性,包括以下5个方面
1. Pearson相关系数探索连续变量相关...
分类:
其他好文 时间:
2015-07-28 21:21:28
阅读次数:
190
测量相关程度的相关系数很多,各种参数的计算方法及特点各异。连续变量的相关指标:此时一般用积差相关系数,又称pearson相关系数来表示其相关性的大小,积差相关系数只适用于两变量呈线性相关时。其数值介于-1~1之间,当两变量相关性达到最大,散点呈一条直线时取值为-1或1,正负号表明了相关的方向,如果两...
分类:
其他好文 时间:
2015-03-05 12:28:46
阅读次数:
188