码迷,mamicode.com
首页 > 其他好文 > 详细

理解协方差矩阵

时间:2019-12-10 22:41:34      阅读:156      评论:0      收藏:0      [点我收藏+]

标签:方差   ++   一个   mamicode   图片   相关性   ctime   大小   用两个   

1. 方差和协方差的定义

在统计学中,方差是用来度量单个随机变量的离散程度,而协方差则一般用来刻画两个随机变量的相似程度,其中,方差的计算公式为
技术图片 
其中,技术图片 表示样本量,符号 技术图片 表示观测样本的均值。

协方差的计算公式被定义为:

技术图片

 

 

 在公式中,符号 技术图片 分别表示两个随机变量所对应的观测样本均值,据此,我们发现:方差 技术图片可视作随机变量 技术图片 关于其自身的协方差 技术图片 .

2. 从方差/协方差到协方差矩阵

根据方差的定义,给定 技术图片 个随机变量 技术图片 ,则这些随机变量的方差为

技术图片

其中, 技术图片 表示随机变量 技术图片 中的第 技术图片 个观测样本, 技术图片 表示样本量,每个随机变量所对应的观测样本数量均为 技术图片 。

 

其中,为方便书写, 技术图片 表示随机变量 技术图片 中的第 技术图片 个观测样本, 技术图片 表示样本量,每个随机变量所对应的观测样本数量均为 技术图片 。

技术图片

 

 

 

因此,协方差矩阵为

技术图片

其中,对角线上的元素为各个随机变量的方差,非对角线上的元素为两两随机变量之间的协方差,根据协方差的定义,我们可以认定:矩阵 技术图片 为对称矩阵(symmetric matrix),其大小为 技术图片

为了便于理解,我们先从两个变量的协方差矩阵来理解:

2.1 两个变量的协方差矩阵

假设我们有 4 个样本,每个样本都有两个变量,也就是两个特征,它们表示如下: 技术图片, 技术图片 , 技术图片 , 技术图片

 

用一个矩阵表示为:

 技术图片

 

 

 现在,我们用两个变量空间技术图片 ,技术图片 来表示这两个特征:

技术图片

 

 

 由于协方差反应的是两个变量之间的相关性,因此,协方差矩阵表示的是所有变量之间两两相关的关系,具体来讲,一个包含两个特征的矩阵,其协方差矩阵应该有技术图片 大小:

技术图片 

接下来,就来逐一计算 技术图片 的值。 首先,我们需要先计算出 技术图片 , 技术图片 两个特征空间的平均值: 技术图片 , 技术图片 。 然后,根据协方差的数学定义,计算协方差矩阵的每个元素:

技术图片

 

 

 技术图片

 

 

 技术图片

 

 

 技术图片

 

 

 

所以协方差矩阵:

技术图片

 

我们已经可以从中总结出协方差矩阵 技术图片 的「计算公式」:

技术图片

 

 2.2 多个变量的协方差矩阵

接下来,就用上面推出的计算协方差矩阵的「计算公式」。 假设我们有三个样本: 技术图片 , 技术图片 , 技术图片 。 同理我们将它们表示成样本矩阵:

技术图片

按照上面给出的计算套路,我们需要先计算出矩阵每一列的均值,从左到右分别为:2、3、1.67、3.33。 然后按照上面讲到的公式,计算矩阵每个元素的值,对了,四个变量的协方差矩阵,大小为 技术图片 :

技术图片

....

3. 理解协方差矩阵

这是一个三维的例子,跟上面的例子差不多,只不过换了一种表达方式:

技术图片

 

 

 

理解协方差矩阵

标签:方差   ++   一个   mamicode   图片   相关性   ctime   大小   用两个   

原文地址:https://www.cnblogs.com/jiashun/p/Covariance.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!