1.本福特定律 2.商品推荐的惊喜度 3.贝叶斯学派和频率学派 4.指数分布族 5.期望 6.方差 7.协方差 8.皮尔逊相关系数 ...
分类:
其他好文 时间:
2017-01-08 18:59:46
阅读次数:
322
一.K-L变换 说PCA的话,必须先介绍一下K-L变换了。 K-L变换是Karhunen-Loeve变换的简称,是一种特殊的正交变换。它是建立在统计特性基础上的一种变换,有的文献也称其为霍特林(Hotelling)变换,因为他在1933年最先给出将离散信号变换成一串不相关系数的方法。K-L变换的突出 ...
分类:
其他好文 时间:
2016-12-31 17:59:28
阅读次数:
337
K-L变换( Karhunen-Loeve Transform)是建立在统计特性基础上的一种变换,有的文献也称为霍特林(Hotelling)变换,因他在1933年最先给出将离散信号变换成一串不相关系数的方法。K-L变换的突出优点是去相关性好,是均方误差(MSE,Mean Square Error)意 ...
分类:
其他好文 时间:
2016-12-23 01:40:23
阅读次数:
260
data数据源,请参考我的博客http://www.cnblogs.com/wwxbi/p/6063613.html import org.apache.Spark.sql.DataFrameStatFunctions 相关系数 ...
分类:
其他好文 时间:
2016-12-02 14:31:56
阅读次数:
406
多元回归 回顾一下简单线性回归:一个特征,两个相关系数 实际的应用要比这种情况复杂的多,比如 1、房价和房屋面积并不只是简单的线性关系。 2、影响房价的因素有很多,不仅仅是房屋面积,还包括很多其他因素。 现在描述第一种情况,房价和房屋面积不只是简单的线性关系,可能是二次或者多项式: 二次函数: 多项 ...
分类:
系统相关 时间:
2016-11-29 14:17:48
阅读次数:
164
mean均值,variance方差,stddev标准差,corr(Pearson相关系数),skewness偏度,kurtosis峰度 ...
分类:
其他好文 时间:
2016-11-25 20:00:48
阅读次数:
153
--众数--中位数--平均数python:mean()--方差(总计方差【n】&样本方差【n-1】)python:var()R算的方差都是样本方差;而Python中的则是总体方差。--标准差(开方方差√方差)python:std()--标准差系数(标准差/平均数*100%):标准差相对平均数的大校--样本协方差(表示样本..
分类:
其他好文 时间:
2016-11-20 16:28:53
阅读次数:
154
摘要: 1.常见的距离算法 1.1欧几里得距离(Euclidean Distance)以及欧式距离的标准化(Standardized Euclidean distance) 1.2马哈拉诺比斯距离(Mahalanobis Distance) 1.3曼哈顿距离(Ma... ...
分类:
编程语言 时间:
2016-11-08 07:51:29
阅读次数:
301
1.数据集成需考虑的问题 a.模式集成和对象匹配 b.冗余。原因一:能够用一个或一组属性导出,原因二:属性或维命名的不一致。 2.属性冗余的相关分析检测 a.数值属性计算相关系数 说明:n为元祖个数,ai,bi分别为元祖i中属性A,B的值。-A,-B分别为A和B的均值,然后是A,B的标准差,然后是A ...
分类:
其他好文 时间:
2016-11-01 13:43:20
阅读次数:
199
先说独立与相关的关系:对于两个随机变量,独立一定不相关,不相关不一定独立。有这么一种直观的解释(不一定非常准确):独立代表两个随机变量之间没有任何关系,而相关仅仅是指二者之间没有线性关系,所以不难推出以上结论。 衡量随机变量相关性的方法主要有三种:pearson相关系数,spearman相关系数,k ...
分类:
其他好文 时间:
2016-09-30 02:26:33
阅读次数:
206