标签:表示 变量 || lin psi 联合 代参 The 参数估计
一般地,用\(Y\)表示观测随机变量的数据,\(Z\)表示隐随机变量的数据,\(Y\)和\(Z\)连在一起称为完全数据,观测数据\(Y\)又称为不完全数据。假设给定观测数据\(Y\),其概率分布是\(P(Y|\theta)\),其中\(\theta\)是需要估计的模型参数。那么不完全数据\(Y\)的似然函数是\(P(Y|\theta)\),完全数据的联合概率分布是\(P(Y,Z|\theta)\)
EM算法通过迭代求\(L(\theta)=\log P(Y|\theta)\)的极大似然估计。每次迭代包含两步:E步,求期望;M步,求极大化:
输出:模型参数\(\theta\)
选择参数的初始值\(\theta^{(0)}\),开始迭代
E步:记\(\theta^{(i)}\)为第\(i\)次迭代参数\(\theta\)的估计值,在第\(i+1\)次迭代的E步,计算\(Q\)函数
\[\begin{aligned}
Q(\theta,\theta^{(i)}) &=E_Z[\log P(Y,Z|\theta)|Y,\theta^{(i)}] \ & =\sum_Z \log P(Y,Z|\theta) P(Z|Y,\theta^{(i)})
\end{aligned}\]
这里,\(P(Z|Y,\theta^{(i)})\)是在给定观测数据\(Y\)和当前的参数估计下隐变量数据\(Z\)的条件概率分布
M步:求使\(Q(\theta,\theta^{(i)})\)极大化的\(\theta\),确定第\(i+1\)次迭代的参数估计值\(\theta^{(i+1)}\)
\[\theta^{(i+1)}=\mathop{\arg\max}\limits_{\theta} Q(\theta,\theta^{(i)})\]
重复第2和第3步,直到收敛
终止迭代条件,一般是对较小的正数\(\epsilon_1,\epsilon_2\),若满足
\[||\theta^{(i+1)}-\theta^{(i)}||<\epsilon_1 \qquad ||Q(\theta^{(i+1)},\theta^{(i)})-Q(\theta^{(i)},\theta^{(i)})||<\epsilon_2\]
则停止迭代
标签:表示 变量 || lin psi 联合 代参 The 参数估计
原文地址:https://www.cnblogs.com/weilonghu/p/11922346.html