一般地,用$Y$表示观测随机变量的数据,$Z$表示隐随机变量的数据,$Y$和$Z$连在一起称为完全数据,观测数据$Y$又称为不完全数据。假设给定观测数据$Y$,其概率分布是$P(Y|\theta)$,其中$\theta$是需要估计的模型参数。那么不完全数据$Y$的似然函数是$P(Y|\theta)$ ...
分类:
编程语言 时间:
2019-11-24 15:39:44
阅读次数:
82
逻辑回归 sigmoid函数=$\sigma(x)=\frac{1}{1+e^{ x}}=\frac{e^{x}}{1+e^{x}}$ 二项逻辑回归模型 有如下条件概率分布,$w$内已经包含了偏置$b$: $$P(Y=1|x)=\frac{\exp(w\cdot x)}{1+\exp(w\cdot ...
分类:
其他好文 时间:
2019-11-24 15:30:55
阅读次数:
75
基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对于给定的输入,利用贝叶斯定理求出后验概率最大的输出$y$。 朴素贝叶斯法通过训练数据集学习联合概率分布$P(X,Y)$。具体地,学习以下先验概率分布及条件概率分布。先 ...
分类:
其他好文 时间:
2019-11-24 15:20:43
阅读次数:
67
高斯混合模型 混合模型,顾名思义就是几个概率分布密度混合在一起,而高斯混合模型是最常见的混合模型; GMM,全称 Gaussian Mixture Model,中文名高斯混合模型,也就是由多个高斯分布混合起来的模型; 概率密度函数为 K 表示高斯分布的个数,αk 表示每个高斯分布的系数,αk>0,并 ...
分类:
编程语言 时间:
2019-11-18 18:18:47
阅读次数:
84
假设,Z_i表示来自某概率分布的N次独立采样。那么,根据大数定律,只要期望E[Z]有限,则下式成立: (Z_1+Z_2+Z_3+...+Z_N)/N-->E[Z],N->无穷 用文字表述,即来自同一分布的一组随机变量,其均值收敛于该分布的期望。 ...
分类:
其他好文 时间:
2019-11-06 13:48:28
阅读次数:
83
首先我们需要搞清楚几个概念:概率函数、概率分布、概率密度 我这里只做简单阐述,意在理解概念,可能不严谨。 我们知道变量可分为离散随机变量和连续随机变量; 概率函数:随机变量取某个值的概率 pi=P(X=ai)(i=1,2,3,4,5,6);以骰子为例,每次摇骰子取值为 1-6,取每个数字的概率为 1 ...
分类:
其他好文 时间:
2019-11-02 16:10:23
阅读次数:
82
Tukey法 在介绍Tukey方法前,首先了解学生化极差分布。 在概率论和统计学中,学生化极差分布是极差的抽样分布。该分布是一种连续型概率分布,用于在样本量较小且总体标准差未知的情况下估计正态分布总体的极差。 假设要比较的组数为k,那么在零假设成立的条件下,下面的随机变量服从学生化极差分布。 ...
分类:
其他好文 时间:
2019-11-01 21:00:08
阅读次数:
109
X ~ :随机变量X的取值和其对应的概率值P(X = ) 满足正态分布(高斯函数) 很多随机现象可以用正态分布描述或者近似描述 某些概率分布可以用正态分布近似计算 正态分布(又称高斯分布)的概率密度函数 numpy中 numpy.random.normal(loc=0.0, scale=1.0, s ...
分类:
其他好文 时间:
2019-11-01 20:05:45
阅读次数:
1150
K L 散度 K L 散度 K L 散度在信息系统中称为 相对熵 ,可以用来量化两种概率分布 P 和 Q 之间的差异,它是非对称性的度量。在概率学和统计学上,我们经常会使用一种更简单的、近似的分布来替代观察数据或太复杂的分布。K L散度能帮助我们度量使用一个分布来近似另一个分布时所损失的信息量。一般 ...
分类:
其他好文 时间:
2019-10-12 01:28:07
阅读次数:
147
吴亚联 1 , 梁坤鑫 1 , 苏永新 1* , 詹 俊 2(1.湘潭大学 信息工程学院, 湖南 湘潭 411105; 2.湖南优利泰克自动化系统有限公司, 湖南 长沙 410205) 摘 要: 为提高风电机组部件故障预警的精度和速度, 文章提出了一种基于SCADA数据的风电机组部件故障预警方法, ...
分类:
其他好文 时间:
2019-10-09 16:03:42
阅读次数:
87