为什么协方差为0的时候,连个点的关系最小? 由于上面我们已经将每个字段的均值都化0 了,因此方差可以直接用每个元素的平方和除以元素个数表示: ...
分类:
其他好文 时间:
2019-12-12 01:16:38
阅读次数:
195
相关总结: 在两个随机变量计算完相关系数之后,该系数还不能使用(只能说明两个变量呈何种相关关系,比如正相关或者负相关,x与y的变异有XX可由两者之间的线性关系来表示), 即不能用R代表相关系数,r必须经过显著性检验才行。r经显著性检验的结果呈不显著时,便推断两变数间不存在相关关系, 这时不能用r代表 ...
分类:
其他好文 时间:
2019-12-11 20:57:48
阅读次数:
104
1. 方差和协方差的定义 在统计学中,方差是用来度量单个随机变量的离散程度,而协方差则一般用来刻画两个随机变量的相似程度,其中,方差的计算公式为 其中, 表示样本量,符号 表示观测样本的均值。 协方差的计算公式被定义为: 在公式中,符号 分别表示两个随机变量所对应的观测样本均值,据此,我们发现:方差 ...
分类:
其他好文 时间:
2019-12-10 22:41:34
阅读次数:
156
本节内容: 0:小知识 1:新数据要如何进行分析 2:第二步骤:理解数据 3:第三步骤:相关分析 0:小知识 0.1:我们说对分析一个数据一般是分步骤的:那么我们可以对其中的步骤进行打标签,也就是跟书签一样。 Ctrl+Shift+r 0.2: 将图形赋值一个变量后,这个变量其中会有图形的一些信息如 ...
分类:
其他好文 时间:
2019-12-04 20:29:44
阅读次数:
142
1. 欧氏距离(Euclidean Distance) 欧氏距离是最容易直观理解的距离度量方法,我们小学、初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。 二维平面上点a(x1,y1)与b(x2,y2)间的欧氏距离: 三维空间点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离: ...
分类:
其他好文 时间:
2019-12-02 18:35:57
阅读次数:
109
均值:描述的是样本集合的中间点。 方差:描述的是样本集合的各个样本点到均值的距离之平均,一般是用来描述一维数据的。 协方差: 是一种用来度量两个随机变量关系的统计量。 只能处理二维问题。 计算协方差需要计算均值。 如下式: 方差与协方差的关系 方差是用来度量单个变量 “ 自身变异”大小的总体参数,方 ...
分类:
其他好文 时间:
2019-11-26 23:00:38
阅读次数:
113
主成分分析 线性、非监督、全局的降维算法 PCA最大方差理论 出发点:在信号处理领域,信号具有较大方差,噪声具有较小方差 目标:最大化投影方差,让数据在主投影方向上方差最大 PCA的求解方法: 对样本数据进行中心化处理 求样本协方差矩阵 对协方差矩阵进行特征分解,将特征值从大到小排列 取特征值前d大 ...
分类:
其他好文 时间:
2019-11-24 15:58:56
阅读次数:
102
1.线性相关系数(皮尔逊相关系数)(用于描述两个变量之间相关性的强弱,系数越大相关性越强) rxy=∑(xi-x-)(yi-y-)÷√∑(xi-x-)2(yi-y-)2 一般判别效力为: 无相关←0.2←弱→0.4←中→0.6←强→0.8←极强→1 2.决定系数(用于描述非线性或两个以上自变量的相关 ...
分类:
其他好文 时间:
2019-11-23 09:31:33
阅读次数:
100
相关系数度量指的是两个不同事件彼此之间的相互影响程度;而自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象的讲就是度量自己过去的行为对自己现在的影响。 自相关,也称 序列相关。是一个信号于其自身在不同时间点的互相关。非正式地来说,它就是两次观察之间的相似度对它们之间的时间差的函数。它是找出 ...
分类:
其他好文 时间:
2019-11-22 13:37:27
阅读次数:
94
多元正态分布 正态分布大家都非常熟悉了,多元正态分布就是多维数据的正态分布,其概率密度函数为 上式为 x 服从 k 元正态分布,x 为 k 维向量;|Σ| 代表协方差矩阵的行列式 二维正态分布概率密度函数为钟形曲面,等高线是椭圆线族,并且二维正态分布的两个边缘分布都是一维正态分布,如图 np.ran ...
分类:
其他好文 时间:
2019-11-20 16:54:13
阅读次数:
155