1. 最大似然估计法的思想 在已经得到试验结果的情况下,我们应该寻找使这个结果出现的可能性最大的那个θ作为真θ的估计。 2. 离散型随机变量 设X为离散型随机变量,其概率分布的形式为 ,则样本的概率分布为 ,在 固定时,上式表示取值的概率;当 固定时,它是 的函数,我们把它记为 并称为似然函数。 似 ...
分类:
其他好文 时间:
2017-03-25 22:41:29
阅读次数:
178
贝叶斯法则 贝叶斯法则又被称为贝叶斯定理、贝叶斯规则,是指概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。当分析样本大到接近总体数时,样本中事件发生的概率将接近于总体中事件发生的概率。 贝叶斯统计中的两个基本概念是先验分布和后验分布: 1、先验分布。总体分布参 ...
分类:
其他好文 时间:
2017-03-08 17:34:37
阅读次数:
238
1.常见离散变量的概率分布 2.常见连续变量的概率分布: 共轭分布: 伯努利分布和Beta分布互为共轭: Beta 分布 多项分布和狄利克雷分布互为共轭 拉普拉斯分布:待续 ...
分类:
其他好文 时间:
2017-03-07 09:09:27
阅读次数:
763
本报告总结了 NIPS 上 Ian Goodfellow 的 生成式对抗网络课程。其内容有:(1)为何生成式建模是值得学习的话题;(2)生成式模型如何工作,GAN 与其他生成式模型的比较;(3)GAN 工作原理;(4)GAN 的研究前沿;(5)将 GAN 和其他方法组合的当前最优的图像模型。最后给出 ...
分类:
其他好文 时间:
2017-02-27 19:20:45
阅读次数:
742
首先,大概讲一下自然语言处理的背景。互联网上充斥着大规模、多样化、非结构化的自然语言描述的文本,如何较好的理解这些文本,服务于实际业务系统,如搜索引擎、在线广告、推荐系统、问答系统等, 给我们提出了挑战。例如在效果广告系统中,需要将 Query(User or Page) 和广告 Ad 投影到相同的 ...
分类:
其他好文 时间:
2017-02-18 18:49:11
阅读次数:
2428
1 模型定义 错误衡量使用平方错误: 注:这里Eout计算是在考虑噪声的情况下,可以将x和y看作满足一个联合概率分布。 ...
分类:
其他好文 时间:
2017-01-19 09:35:34
阅读次数:
265
LDA算法太难?怎么也学不明白?学明白了也不知道有什么用?来看看这篇文章!真正的学以致用! 在开始之前,让我们看看LDA算法的黑盒描述。LDA算法要求你选择一些类(主题)并输入一个文档语料库。它的输出是一个主题的列表,每一个主题都是基于单词的概率分布。LDA模型也能够对文档进行分类,并为每个主题分配 ...
分类:
其他好文 时间:
2017-01-10 15:00:00
阅读次数:
219
1.常见离散变量的概率分布 2.常见连续变量的概率分布: ...
分类:
其他好文 时间:
2017-01-07 13:17:36
阅读次数:
161
1.自然底数e的由来:知乎问答 2.正态分布的前世今生:pdf 3.常见概率分布图表总结: ...
分类:
其他好文 时间:
2017-01-07 12:15:49
阅读次数:
218
摘要: 1.定义 2.常见算法 3.区别 4.优缺点 内容: 1.定义 1.1 生成模型: 在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布(joint probability distribution)。在机 ...
分类:
其他好文 时间:
2016-12-23 01:33:42
阅读次数:
171