具体实现过程见substitution of int from 1 to n 随机数算法知识: kitty的随机数算法博客; 蒙特卡洛法:统计实验法,大量模拟求概率,用于不可解析函数,或概率分布,的模拟与计算时 将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解 ...
分类:
编程语言 时间:
2018-02-21 15:02:23
阅读次数:
187
监督学习可以分为生成方法与判别方法,所学到的模型可以分为生成模型与判别模型。 生成模型 生成模型由数据学习联合概率分布$P(X,Y)$,然后求出条件概率分布$P(Y|X)$作为预测的模型,即生成模型: $$P(Y|X)=\frac{P(X,Y)}{P(X)}$$ 这样的方法之所以称为生成方法,是因为 ...
分类:
其他好文 时间:
2018-02-07 16:52:22
阅读次数:
242
主要分为几个部分: NER+消歧,NERC+CRF,POS Tagging+HMM+实例提取,事实提取+信息提取+马尔科夫逻辑,语义网+可决定性,数据安全。 NER+消歧: NER目的:找entity名字 NER的两种方式:字典,正则 字典分为两类:传统字典和TRIE,传统字典慢,TRIE是单词树, ...
分类:
其他好文 时间:
2018-01-30 12:28:36
阅读次数:
247
理解一下这些基础知识 先验概率(prior probability) 是指根据以往经验和分析得到的概率,如全概率公式,它往往作为 "由因求果" 问题中的 "因" 出现的概率。 在贝叶斯统计中,先验概率分布,即关于某个变量 X 的概率分布,是在获得某些信息或者依据前,对 X 之不确定性所进行的猜测。这 ...
分类:
其他好文 时间:
2018-01-20 18:54:35
阅读次数:
182
Preface 从 现场回来后,做了一些 的工作。主要是觉得RL是一个有意思的领域,而深度网络逼近对这个问题提供了良好的可预期的解决方案。本来想找些程序先做个参考,发现都是些打游戏场景;之前看textbook的时候,对 ( "Artificial Intelligence: A Modern App ...
分类:
Web程序 时间:
2018-01-18 11:42:35
阅读次数:
231
P ( x | y ):在Y发生的条件下,X发生的概率。P ( x , y )P(x,y)说明该事件与两个因素有关,比如设是因素A,B.P(x,y)=P{因素A处于x状态,因素B处于y状态}确切地说P(x,y)是联合分布概率。设X和Y是两个随机变量,其联合分布就是同时对于X和Y的概率分布.P(x,y ...
分类:
其他好文 时间:
2018-01-17 00:53:35
阅读次数:
241
只是略微的看了些,有点感觉,还未深入,做个记录。 参考: 隐马尔可夫 (HMM)、前 / 后向算法、Viterbi 算法 再次总结 谁能通俗的讲解下 viterbi 算法? 数学之美第二版的第 26 章 本文结构: 1.hmm三要素 2.维特比算法 3.简明例子 hmm三要素: 1.初始概率分布 π ...
分类:
编程语言 时间:
2018-01-17 00:35:22
阅读次数:
354
生成目标句子单词的过程成了下面的形式:每个Ci可能对应着不同的源语句子单词的注意力分配概率分布没有引入注意力机制的Encoder-Decoder的模型如下:
分类:
其他好文 时间:
2018-01-16 18:00:35
阅读次数:
126
原文 如何通俗的解释交叉熵与相对熵? 相关公式: 假设现在有一个样本集中两个概率分布 p,q,其中 p 为真实分布,q 为非真实分布。假如,按照真实分布 p 来衡量识别一个样本所需要的编码长度的期望为: H(p)= 但是,如果采用错误的分布 q 来表示来自真实分布 p 的平均编码长度,则应该是: H ...
分类:
其他好文 时间:
2018-01-15 18:45:10
阅读次数:
193
【随机变量】 设随机实验的样本空间是 S=|e| ,X = X(e) 是定义在样本空间S上的实值单值函数,称 X = X(e) 为随机变量。 【概率分布率】 设随机变量 X ,其所有可能去的不同值为: 取各个值的可能的概率分别为: 即: 若该公式满足以下条件,则称为随机变量X的概率分布率,简称分布率 ...
分类:
其他好文 时间:
2018-01-13 20:44:48
阅读次数:
143