1.17-18:学习HMM模型;1.18-20:学习CRF模型(未完成);1.20-24:应用HMM到具体问题;1.24-27:扩展为second-order HMM(扩展Bi-gram MLE到Tri-gram MLE;扩展Viterbi算法);明确了BW算法不适合正在解决的问题;1.28:在词性...
分类:
其他好文 时间:
2015-01-30 15:36:58
阅读次数:
175
转自http://blog.csdn.net/abcjennifer/article/category/1173803/3本文简明讲述GMM-HMM在语音识别上的原理,建模和测试过程。这篇blog只回答三个问题:1.什么是Hidden Markov Model?HMM要解决的三个问题:1) Like...
分类:
其他好文 时间:
2015-01-30 14:33:18
阅读次数:
244
一:HMM解码问题
(1)编程深处无非就是算法和结构,以及各种架构和版本的管理(如Git管理),因此作为程序员算法这一关是绕不过去的;
(2)关于算法,个人比较崇尚的一本书是《算法导论》和ACM实战系类的算法培训;
(3)对于自然语言处理领域或者部分机械学习领域的算法,HMM模型是非常经典的算法之一,非常适合初学者学习和研究;
(4)HMM模型μ=(A,B,π),的状态是不可见...
分类:
其他好文 时间:
2015-01-19 10:53:05
阅读次数:
234
中文分词是中文文本处理的一个基础性工作,结巴分词利用进行中文分词。其基本实现原理有三点:基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG)采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合对于未登录词,采用了基于汉字成词能力的HMM模型,使用了...
分类:
编程语言 时间:
2015-01-17 15:11:28
阅读次数:
183
原文链接:http://www.cnblogs.com/zhangchaoyang/articles/2219571.html此外,http://www.leexiang.com/hidden-markov-model 写的也很清楚明了。HMM介绍Hidden Markov Models是一种统计信...
分类:
其他好文 时间:
2015-01-17 09:55:41
阅读次数:
164
一:HMM解码问题
(1)给定一个观察序列O=O1O2...OT,和模型μ=(A,B,π),如何快速有效地选择在一定意义下“最优”的状态序列Q=q1q2...qT,使该状态最好地解释观察序列。
(2)最可能的隐藏状态序列(Finding most probable sequence of hidden states);对于一个特殊的隐马尔科夫模型(HMM)及一个相应的观察序列,我们常常希望能找...
分类:
其他好文 时间:
2015-01-16 13:11:21
阅读次数:
232
算法+语料≈NLP这是一个六千万词汇量的分类词库,做HanLP这么久,我逐渐体会到,算法无法解决所有问题,词库也非常重要。通常一个算法可以解决80%的问题,剩下的20%无论怎么调节优化,都是拆东墙补西墙。比如上次我提到的“区人保”被HMM人名识别模块误命中的例子,这个词让HMM来看,“区”作为姓氏,...
分类:
其他好文 时间:
2015-01-15 12:49:18
阅读次数:
330
http://www.hankcs.com/nlp/ner/place-names-to-identify-actual-hmm-viterbi-role-labeling.html命名实体识别(Named Entity Recognition)也是自然语言处理中的一个难关,特别是中文这样没有大小写...
分类:
其他好文 时间:
2015-01-14 19:47:46
阅读次数:
279
HMM隐马尔可夫,隐,说明模型里面含有隐含节点,是我们所无法直接观测到的,这些隐含节点上的状态可以称为隐含状态;马尔科夫,说明模型具有马尔科夫性,一个节点的状态只跟它的邻居有关,与其他节点无关,与时间也无关。我们把节点分为两类,状态节点(隐)和可观察节点(显)。并且假设状态节点为链式结构,每个输出(...
分类:
其他好文 时间:
2015-01-12 10:40:45
阅读次数:
217
隐马尔可夫模型(Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及HMM的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想花一点时间梳理下...
分类:
其他好文 时间:
2015-01-09 12:05:06
阅读次数:
193