安装:1.先把hmm toolbox解压,生成一个文件夹HMMall,里面包含四个文件夹。把HMMall拷贝到路径c:\program files (x86)\matlab\r2010b\toolbox下,c:\program files(x86)\matlab\r2010b是matlab的安装路径...
分类:
其他好文 时间:
2014-11-25 18:00:42
阅读次数:
324
hidden markov modelmarkov model: 把一个总随机过程看成一系列状态的不断转移, 其特性主要使用转移概率来表示。HMM:认为模型的状态是不可观测的(hidden), 能观测的只是它表现出的一些观测值。MM 的观测序列本身就是状态序列HMM 的观测序列不是状态序列设有N个篮...
分类:
其他好文 时间:
2014-11-19 18:12:10
阅读次数:
302
命名实体识别中最难的部分当属实体机构名了,这是因为机构名的组成成分十分复杂,可以是人名、地名、序数词、企业字号甚至是上级机构名。本文介绍一种基于角色标注的层叠HMM模型下中文机构名识别方法。目前代码已整合到HanLP中,即将开源。原理基本原理请参考《实战HMM-Viterbi角色标注地名识别》,不再...
分类:
其他好文 时间:
2014-11-18 23:49:39
阅读次数:
328
命名实体识别(Named Entity Recognition)也是自然语言处理中的一个难关,特别是中文这样没有大小写等固定形态的语言。上次介绍过《实战HMM-Viterbi角色标注中国人名识别》,这次基于类似的原理,为HanLP实现中文地址地名(NS)的自动识别。原理训练对熟语料自动角色标注,统计...
分类:
其他好文 时间:
2014-11-17 22:42:38
阅读次数:
197
命名实体中的人名识别包括中国人名,音译人名和日本人名。比如“北川景子参演了林诣彬导演,克里斯·摩根编剧的《速度与激情3》”“林志玲亮相网友:确定不是波多野结衣?”。以前用三层HMM做过中国人名的识别,取得了满意的效果。这次来实现另外两种人名的自动识别。音译人名常用字法音译人名按照地域又可以分为欧美人...
分类:
其他好文 时间:
2014-11-13 00:28:16
阅读次数:
286
算法+语料≈NLP这是一个六千万词汇量的分类词库,做HanLP这么久,我逐渐体会到,算法无法解决所有问题,词库也非常重要。通常一个算法可以解决80%的问题,剩下的20%无论怎么调节优化,都是拆东墙补西墙。比如上次我提到的“区人保”被HMM人名识别模块误命中的例子,这个词让HMM来看,“区”作为姓氏,...
分类:
其他好文 时间:
2014-11-08 23:24:08
阅读次数:
474
转自http://blog.csdn.net/lskyne/article/details/8669301路径1-1-1-1的概率:0.4*0.45*0.5=0.09路径2-2-2-2的概率:0.018路径1-2-1-2:0.06路径1-1-2-2:0.066由此可得最优路径为1-1-1-1而实际上...
分类:
其他好文 时间:
2014-11-05 22:47:01
阅读次数:
705
1. 论文【1】中使用了DNN的思想进行对齐,对齐所需训练数据来自HMM和IBM Model4,算上输入层一共是四层结构,见下图: 效果好于原始的HMM和IBM4,见下图: 该思路可以用在许多地方,诸如:片段相似度、句子相似度、翻译概率、词向量等计算上。 不过,实际应用的话,DNN...
分类:
其他好文 时间:
2014-10-25 13:12:21
阅读次数:
774
本文笔记旨在概括地讲deep learning的经典应用。内容太大,分三块。
1. 回顾 deep learning在图像上的经典应用
1.1 Autoencoder
1.2 MLP
1.3 CNN
2. deep learning处理语音等时序信号
2.1 对什么时序信号解决什么问题
2.2 准备知识
2.2.1 Hidden Markov Model(HMM)
2.2.2 GMM-HMM for Speec...
分类:
其他好文 时间:
2014-10-10 11:21:04
阅读次数:
368
一直想用隐马可夫模型做图像识别,但是python的scikit-learn组件包的hmm module已经不再支持了,需要安装hmmlearn的组件,不过hmmlearn的多项式hmm每次出来的结果都不一样,= =||,难道是我用错了??后来又只能去参考网上C语言的组件,模仿着把向前向后算法“...
分类:
编程语言 时间:
2014-10-09 01:54:57
阅读次数:
557