标签:神经网络 初步 数值 math 估计 变量 强化学习 曲线 ora
name | function |
---|---|
hypothesis | \(y(x, \omega ) = \omega _0 + \omega _1 x + \omega _2 x^2 + ... + \omega _M x^M = \sum_{j=0}^{M} \omega _j x^j\) |
loss function / criteria | $E(\omega ) = \frac{1}{2} \sum_{i=0}^{N} { y(x_i, \omega ) - t_i } ^2 = \frac{1}{2} \Vert y(x, \omega ) - t \Vert ^2 _2 $ |
criteria with regularizer | \(\tilde{E}(\omega ) = \frac{1}{2} \sum_{i=0}^{N} \{ y(x_i, \omega ) - t_i \} ^2 + \frac{\lambda}{2} \Vert \omega \Vert ^2 = \frac{1}{2} \Vert y(x, \omega ) - t \Vert ^2 _2 + \frac{\lambda}{2} \Vert \omega \Vert ^2 _2\) |
均方根差(root mean square error)是一种测量数值之间的差异的度量。其计算公式为 \(E_{RMS} = \sqrt{2E(\omega ^*) / N}\)。除以 N 是为了避免测试集和训练集的数据规模的差异,开根是为了使损失函数值与真实标记值在同一量级上。
模式识别的核心概念是 uncertainty ,它由度量过程中的噪声与数据集的不完备性所产生。
sum rule
\[
p(X) = \sum _Y p(X,Y)
\]
product rule
\[
p(X,Y) = p(Y|X)p(X)
\]
Bayes‘ theorem
\[
p(Y \vert X) = \frac{p(X \vert Y)p(Y)}{p(X)} = \frac{p(X \vert Y)p(Y)}{\sum_Y p(X \vert Y) p(Y)}
\]
先验概率(prior probability):在被问及所选盒子种类之前,没有被告知最后选出的水果种类。我们称 p(Box) 是先验概率,因为这是我们在观测到抽出水果种类之前就能获得的概率信息。
后验概率(posterior probability):在被问及所选盒子种类之前,已经被告知了最后选出水果的种类。我们称 P(Box|Fruit) 是后验概率,因为这是我们观测到抽出水果种类之后才获得的概率信息。
标签:神经网络 初步 数值 math 估计 变量 强化学习 曲线 ora
原文地址:https://www.cnblogs.com/luyunan/p/12254422.html