码迷,mamicode.com
首页 >  
搜索关键字:强化学习    ( 328个结果
机器学习pdf
下载地址: "网盘下载" 机器学习是计算机科学与人工智能的重要分支领域. 本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面。 为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用数学知识. 然而, 少量的概率、统计、代数、优化、逻辑知识似乎不可避免. 因此, ...
分类:其他好文   时间:2018-07-22 21:15:47    阅读次数:193
[Deep-Learning-with-Python]机器学习基础
机器学习类型 机器学习模型评估步骤 深度学习数据准备 特征工程 过拟合 解决机器学习问题的一般性流程 机器学习四分支 二分类、多分类以及回归问题都属于监督学习--目标是学习训练输入和对应标签之间的关系。 监督学习只是机器学习的冰山一角。机器学习主要分为4类:监督学习、非监督学习、半监督学习和强化学习 ...
分类:编程语言   时间:2018-07-18 23:33:11    阅读次数:218
【强化学习篇】--强化学习案例详解一
一、前述 本文通过一个案例来讲解Q-Learning 二、具体 1、案例 假设我们需要走到5房间。 转变为如下图:先构造奖励,达到5,即能够走得5的action则说明奖励比较高设置成100,没有达到5说明奖励比较低,设置成0。 Q-learning实现步骤: 2、案例详解: 第一步的Q(1,5):最 ...
分类:其他好文   时间:2018-06-30 23:43:41    阅读次数:236
【强化学习篇】--强化学习从初识到应用
一、前述 强化学习是学习一个最优策略(policy),可以让本体(agent)在特定环境(environment)中,根据当前的状态(state),做出行动(action),从而获得最大回报(G or return)。 通俗点说:学习系统没有像很多其它形式的机器学习方法一样被告知应该做出什么行为,必 ...
分类:其他好文   时间:2018-06-30 17:45:23    阅读次数:118
机器学习常见算法分类汇总
阅读目录 1. 学习方式 1.1 监督式学习 1.2 非监督式学习 1.3 半监督式学习 1.4 强化学习 2. 算法分类 2.1 回归算法 2.2 基于实例的算法 2.3 正则化方法 2.4 决策树学习 2.5 贝叶斯方法 2.6 基于核的算法 2.7 聚类算法 2.8 关联规则学习 2.9 遗传 ...
分类:编程语言   时间:2018-06-18 11:49:57    阅读次数:235
51CTO男子图鉴 新的一年新的进步
这一年来不说得到很多起码坚持了很多坚持了早起七点到公司能够避免堵车还可以在早上状态最好的时候阅读很多书籍关心公司的数据完成一些工作这一年中在公司主要负责算法设计工作,完成了以下几个项目:1、深度学习平台环境的搭建2、实现RSSD算法进行目标检测3、实现人体姿态估计算法实现及公司业务场景应用4、数据决策系统设计实现(大数据报表系统)5、大数据风控系统实现6、基于强化学习的城市运营模拟推演系统实现(该
分类:其他好文   时间:2018-06-12 11:24:42    阅读次数:233
LeetCode 847. Shortest Path Visiting All Nodes的强化学习解法
这题的本意不是要考机器学习的,而且模型已知情况下,可以直接求解,不需要用MC、TD等方式。使用这个代码,即使得到解,也不能通过本题测试。可以初步练习下调参,比如设置不同的奖励,探索衰减等,看看机器找路的特点。本题是要考遍历和找字串等技能。 代码如下: import random as rnd cla ...
分类:其他好文   时间:2018-06-09 23:17:29    阅读次数:656
DQN 处理 CartPole 问题——使用强化学习,本质上是训练MLP,预测每一个动作的得分
代码: 基本思路: 让他自己训练玩这个游戏(每次应该左右移动的距离),基本思路就是: 本质上就是使用MLP训练(动作,得分) 这个得分是坚持时间的长短,如果时间长得分就高。 但是我感觉这个gym自己做了很多事情,比如度量奖励分数,action描述等。待进一步挖掘! ...
分类:其他好文   时间:2018-06-06 21:44:00    阅读次数:1165
CS294-112 深度强化学习 秋季学期(伯克利)NO.21 Guest lecture: Aviv Tamar (Combining Reinforcement Learning and Planning)
contact, friction, etc. are unknown ...
分类:其他好文   时间:2018-05-31 00:43:40    阅读次数:221
328条   上一页 1 ... 21 22 23 24 25 ... 33 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!