码迷,mamicode.com
首页 >  
搜索关键字:马尔科夫    ( 260个结果
【cs229-Lecture16】马尔可夫决策过程
之前讲了监督学习和无监督学习,今天主要讲“强化学习”。 马尔科夫决策过程;Markov Decision Process(MDP) 价值函数;value function 值迭代;value iteration(算法,解决MDP) 政策迭代;policy iteration(算法,解决MDP) 什么...
分类:其他好文   时间:2015-04-13 22:40:50    阅读次数:213
由隐马尔科夫意淫无字典中文分词 C#
using System; using System.Windows.Forms; using System.IO; using System.Text.RegularExpressions; using System.Collections; using System.Collections.Generic; using System.ComponentModel; namespace HMM...
分类:Windows程序   时间:2015-04-07 11:58:15    阅读次数:319
隐马尔科夫模型
特征向量:跟踪框位置相对轨迹中心的比值,角度,速度。马尔科夫模型:State Sequence, q1 q2 ...... qTt个状态之间的转移可见,则这个时间序列的概率是πq1 × aq1q2 × ...... × aqT-1qT隐马尔科夫模型:状态不可见(隐藏),只能从观察值推测出,所以由观察...
分类:其他好文   时间:2015-03-21 01:06:22    阅读次数:222
MDP:马尔科夫决策过程(三)
MDP:马尔科夫决策过程(Markov Decision Process)贝尔曼等式:上节说到,这是对于确定性动作的模型。如果随机性动作的模型,应该表示为即,执行动作后的状态有多个,按照概率乘以值函数得到上式。因此,当前状态最优执行动作就是对于每个状态都有一个Vπ(S) ,所以对于每一步来说,可以得...
分类:其他好文   时间:2015-03-20 12:31:03    阅读次数:108
MDP:马尔科夫决策过程(二)
MDP:马尔科夫决策过程(Markov Decision Process)策略评价:对于确定性动作(deterministic actions),由于状态转换可能是无限的,那么奖惩函数之和的值也可能是无限的;对于随机性动作(stochastic actions),同样,奖惩函数期望之和也有可能是无限...
分类:其他好文   时间:2015-03-20 12:17:10    阅读次数:192
MDP:马尔科夫决策过程(一)
MDP:马尔科夫决策过程(Markov Decision Process)定义:一个马尔可夫模型包括如下部分状态集 S (States)动作集 A (Actions)奖惩函数 R (reward function)在状态 s 下,执行 a 动作的影响函数 T我们假设执行动作 a 的效果只与当...
分类:其他好文   时间:2015-03-20 10:42:02    阅读次数:140
隐马尔科夫模型及Viterbi算法的应用
作者:jostree转载请注明出处http://www.cnblogs.com/jostree/p/4335810.html一个例子:韦小宝使用骰子进行游戏,他有两种骰子一种正常的骰子,还有一种不均匀的骰子,来进行出千。开始游戏时他有2/5的概率出千。对于正常的骰子A,每个点出现的概率都是1/6.对...
分类:编程语言   时间:2015-03-13 21:59:43    阅读次数:368
HMM的学习笔记1:前向算法
HMM的学习笔记   HMM是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测的随机过程。 HMM由两个状态和三个集合构成。他们分别是观测状态序列,隐藏状态序列,转移概率,初始概率和混淆矩阵(观察值概率矩阵)。 HMM的三个假设: 1、有限历史性假设,p(si|si-1,si-2,.....
分类:编程语言   时间:2015-03-12 20:53:00    阅读次数:244
HMM:前向算法实例
看本篇文章,假设你已经知道HMM中的前向算法相关概念 如果不知道,推荐先学习HMM学习最佳范例中相关文章这个问题来自于HMM学习最佳范例五:前向算法5 只不过再手动算一下,加深一下自己的理解已知隐马尔科夫模型如下:1、隐藏状态 (天气):Sunny,Cloudy,Rainy; 2、观察状态(海藻湿度):Dry,Dryish,Damp,Soggy; 3、初始状态概率: Sunny(0.63),...
分类:编程语言   时间:2015-03-05 19:31:13    阅读次数:480
搜索技术(2)
自然语言处理 基于规则 基于统计统计语言模型中文分词 梁南元--查字典 郭进--统计语言模型 Basis Technology 通用分词器 葛显平、朱安隐含马尔科夫模型信息熵贾里尼克、香农、雅各布森、乔姆斯基、弗兰德、哈克特统计语音识别和自然语言处理雅让斯基、布莱尔阿米特.辛格搜索引擎:...
分类:其他好文   时间:2015-02-19 20:43:20    阅读次数:310
260条   上一页 1 ... 20 21 22 23 24 ... 26 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!