之前讲了监督学习和无监督学习,今天主要讲“强化学习”。 马尔科夫决策过程;Markov Decision Process(MDP) 价值函数;value function 值迭代;value iteration(算法,解决MDP) 政策迭代;policy iteration(算法,解决MDP) 什么...
分类:
其他好文 时间:
2015-04-13 22:40:50
阅读次数:
213
统计学习是基于数据构建统计模型从而对数据进行预测与分析,统计学习由监督学习,非监督学习,半监督学习和强化学习等组成
统计学习由模型的假设空间(学习的模型属于某个函数的集合),模型选择的准则,及模型学习的算法
分类:
其他好文 时间:
2014-11-29 21:31:23
阅读次数:
173
在机器学习范畴,根据反馈的不同,学习技术可以分为监督学习(Supervised learning)、非监督学习(Unsupervised learning)和强化学习(Reinforcement learning)三大类。其中强化学习是一种以环境反馈作为输入的、特殊的、适应环境的机器学习方法。所谓强...
分类:
其他好文 时间:
2014-11-27 18:06:35
阅读次数:
168
Machine Learning:Linear Regression With One Variable
机器学习可以应用于计算机视觉,自然语言处理,数据挖掘等领域,可以分为监督学习(Supervised Learning),无监督学习(Unsupervised Learning),强化学习(Reinforcement Learning)等。
首先我们从一个简单...
分类:
系统相关 时间:
2014-11-05 00:30:58
阅读次数:
256
机器学习算法原理、实现与实践——监督学习机器学习包括监督学习、非监督学习、半监督学习及强化学习,这里先讨论监督学习。 监督学习的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。1 基本概念1.1 输入空间、特征空间与输出空间输入与输出所有可能取值的集合分别称为输入空间...
分类:
其他好文 时间:
2014-10-31 09:57:32
阅读次数:
461
机器学习课程要求:掌握基本线性代数(矩阵、矢量、矩阵向量乘法),和基本概率(随机变量、基本属性的概率)以及微积分机器学习:引言课程1 机器学习:引言课程2机器学习算法分为:1.监督式学习算法2.非监督式学习算法3.强化学习算法4.推荐系统机器学习:引言课程3—监督式学习监督式学习...
分类:
其他好文 时间:
2014-10-24 18:34:45
阅读次数:
228
一
统计学习方法概述统计学习对象:数据-->数据特征-->数据模型-->知识-->预测统计学习关于数据的假设:
具有一定统计规律性的同类数据。统计学习目的: 对数据进行预测与分析,尤其是对未知新数据进行分析预测。通过构建概率统计模型实现。统计学习方法:
监督学习,非监督学习,半监督学习,强化学习监督...
分类:
其他好文 时间:
2014-04-28 01:04:26
阅读次数:
583