首页 > 其他好文 > 详细

隐马尔科夫模型的来龙去脉

时间：2015-07-22 06:53:15 阅读：159 评论：0 收藏：0 [点我收藏+]

标签：

作为应用广泛的一种统计模型(尤其是在自然语言处理(NLP)中),隐马尔科夫模型是非常值得一说的，本文就隐马尔科夫模型的原理和应用介绍进行说明。由于隐马尔科夫模型有着很多不同的具体算法实现，本文暂时跳过这部分内容，算法部分会另外写成一篇博文。

马尔科夫链

在语言模型及其实现中，我曾经简单地提到过马尔科夫链,这里将会全面详细的说明。

其实马尔科夫链是一种离散的随即过程，可以将其看成是一种有限自动机，但是其状态之间的转移并不是依赖于外界的输入，而是依赖于每个状态之间的转移概率。

如下图所示:

技术分享

上图中每条边上的权重表示状态转移的概率，对于

现在用更加严谨的数学表达来说明:

假设当前系统中一共有

马尔科夫链有两个假设条件，分别是:

有限视野:当前时刻的状态只与上一个时刻的状态有关。用公式表示就是:
时间独立性:状态转移概率与时间无关。用公式表示就是:

隐马尔科夫模型

而隐马尔科夫模型则是马尔科夫过程的一种扩展，或者说是一种双重的随机过程。隐马尔科夫模型是指，在马尔科夫链中的那些状态

还是先用图来说明吧:

技术分享

上图中的

相对于之前的马尔科夫链，隐马尔科夫模型有以下的不同之处:

观察状态与隐藏状态之间存在概率关系
多一个假设条件,输出独立性:可见状态仅与当前状态有关，用公式说明就是:

隐马尔科夫模型可以用一个五元组来表示:

状态序列

应用

到目前为止所说的隐马尔科夫模型都是太抽象了，仅仅知道它是什么还不能帮助我们完全理解它作用，下面就通过两个隐马尔科夫模型的应用，来说明这个模型的强大之处。

词性标注

在自然语言处理中，词性标注是一个非常基本的任务，简单来说，每一个词，不管是中文还是英语，它在句子中一定会有一个词性标记1

1同一个词在不同的句子中，可能具有不同的词性标记。

，比如名词、形容词等等。确定一个句子中每一个词的词性，是一个最基本的任务，它为后续的其他处理提供了基础信息。

在词性标注的任务中，我们可以将一个句子看成是可见状态序列,每一个词都是一个可见的状态(

拼音输入法

隐马尔科夫模型另外一个比较重要的应用就是拼音输入法，目前主流的拼音输入法或多或少地运用到了隐马尔科夫模型。

在输入法的应用中，我们可以将用户输入的拼音序列看成是可见的状态序列，而拼音所对应的汉语词语就是不可见的隐藏状态，我们的目标是就是在给定拼音序列的情况下，寻找概率最大的隐藏状态序列。如下图所示:

技术分享

其中，

总结

在本篇文章中，只是着重介绍了马尔科夫过程和隐马尔科夫模型及其应用，具体的算法实现全部略过了，这是因为其实现算法中也包含了很多的内容，因此我打算将算法部分单独写成一篇博文，本篇文章中就没有涉及算法部分的内容了。

这里可以做一下简单的说明,隐马尔科夫模型的实现过程，主要有两大步骤:

模型参数的学习，也即要学习获得隐马尔科夫模型5个要素中的转移概率矩阵
模型解码，也即在给定转移矩阵和可见转台序列的情况下，如何寻找到最有的隐藏状态序列，这个过程可以利用基于动态规划思想的Viterbi算法来解决。

参考资料

转载自：http://zhouyichu.com/nlp/Hidden-Markov-Model.html

隐马尔科夫模型的来龙去脉

标签：

原文地址：http://www.cnblogs.com/chenying99/p/4666134.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！