之前讲了监督学习和无监督学习,今天主要讲“强化学习”。 马尔科夫决策过程;Markov Decision Process(MDP) 价值函数;value function 值迭代;value iteration(算法,解决MDP) 政策迭代;policy iteration(算法,解决MDP) 什么...
分类:
其他好文 时间:
2015-04-13 22:40:50
阅读次数:
213
using System;
using System.Windows.Forms;
using System.IO;
using System.Text.RegularExpressions;
using System.Collections;
using System.Collections.Generic;
using System.ComponentModel;
namespace HMM...
特征向量:跟踪框位置相对轨迹中心的比值,角度,速度。马尔科夫模型:State Sequence, q1 q2 ...... qTt个状态之间的转移可见,则这个时间序列的概率是πq1 × aq1q2 × ...... × aqT-1qT隐马尔科夫模型:状态不可见(隐藏),只能从观察值推测出,所以由观察...
分类:
其他好文 时间:
2015-03-21 01:06:22
阅读次数:
222
MDP:马尔科夫决策过程(Markov Decision Process)贝尔曼等式:上节说到,这是对于确定性动作的模型。如果随机性动作的模型,应该表示为即,执行动作后的状态有多个,按照概率乘以值函数得到上式。因此,当前状态最优执行动作就是对于每个状态都有一个Vπ(S) ,所以对于每一步来说,可以得...
分类:
其他好文 时间:
2015-03-20 12:31:03
阅读次数:
108
MDP:马尔科夫决策过程(Markov Decision Process)策略评价:对于确定性动作(deterministic actions),由于状态转换可能是无限的,那么奖惩函数之和的值也可能是无限的;对于随机性动作(stochastic actions),同样,奖惩函数期望之和也有可能是无限...
分类:
其他好文 时间:
2015-03-20 12:17:10
阅读次数:
192
MDP:马尔科夫决策过程(Markov Decision Process)定义:一个马尔可夫模型包括如下部分状态集 S (States)动作集 A (Actions)奖惩函数 R (reward function)在状态 s 下,执行 a 动作的影响函数 T我们假设执行动作 a 的效果只与当...
分类:
其他好文 时间:
2015-03-20 10:42:02
阅读次数:
140
作者:jostree转载请注明出处http://www.cnblogs.com/jostree/p/4335810.html一个例子:韦小宝使用骰子进行游戏,他有两种骰子一种正常的骰子,还有一种不均匀的骰子,来进行出千。开始游戏时他有2/5的概率出千。对于正常的骰子A,每个点出现的概率都是1/6.对...
分类:
编程语言 时间:
2015-03-13 21:59:43
阅读次数:
368
HMM的学习笔记
HMM是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测的随机过程。
HMM由两个状态和三个集合构成。他们分别是观测状态序列,隐藏状态序列,转移概率,初始概率和混淆矩阵(观察值概率矩阵)。
HMM的三个假设:
1、有限历史性假设,p(si|si-1,si-2,.....
分类:
编程语言 时间:
2015-03-12 20:53:00
阅读次数:
244
看本篇文章,假设你已经知道HMM中的前向算法相关概念
如果不知道,推荐先学习HMM学习最佳范例中相关文章这个问题来自于HMM学习最佳范例五:前向算法5
只不过再手动算一下,加深一下自己的理解已知隐马尔科夫模型如下:1、隐藏状态 (天气):Sunny,Cloudy,Rainy;
2、观察状态(海藻湿度):Dry,Dryish,Damp,Soggy;
3、初始状态概率: Sunny(0.63),...
分类:
编程语言 时间:
2015-03-05 19:31:13
阅读次数:
480
自然语言处理 基于规则 基于统计统计语言模型中文分词 梁南元--查字典 郭进--统计语言模型 Basis Technology 通用分词器 葛显平、朱安隐含马尔科夫模型信息熵贾里尼克、香农、雅各布森、乔姆斯基、弗兰德、哈克特统计语音识别和自然语言处理雅让斯基、布莱尔阿米特.辛格搜索引擎:...
分类:
其他好文 时间:
2015-02-19 20:43:20
阅读次数:
310