码迷,mamicode.com
首页 >  
搜索关键字:强化学习    ( 328个结果
<强化学习>开门帖
今天是2020年2月7日,开始二刷david silver ulc课程. david silver课件汇总:(共10节课) http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html 一些小总结: 1.强化学习不同于其他机器学习算法,它们的基础 ...
分类:其他好文   时间:2020-02-08 00:37:15    阅读次数:88
如何学习一门新技术
[toc] 1. 如何学习一门新技术 学习步骤 1:完形填空的方法从整体了解;了解技术的套路,模板;执行流程,重复代码; 2:深度学习 3:通过案例倒逼技术的驱动; 考试倒逼学习法: 对于各种微服务项目,进行整合,进而对于技术进行强化学习; 1. 技术难点: 偏离论:拆解目标, 碎片化学习; 偏实践 ...
分类:其他好文   时间:2020-02-07 20:47:50    阅读次数:88
如何用adc的芯片来强化学习——二进制的补码
部分参考了https://www.cnblogs.com/songdechiu/p/5397070.html 一、补码的优点 1、可以将减法转化为加法,在计算机中只保留加法 2、将符号位参与运算 二、如何实现? 我们先以钟表为例子,假设现在的标准时间为4点整,而有一个钟的时间为7点整。我们可以将时针 ...
分类:其他好文   时间:2020-02-07 12:28:03    阅读次数:313
强化学习介绍
强化学习算法类型 策略梯度:可直接区别以上的目标 基于值:估计最优策略(不明确哪个是最优的策略情况下估计)的值函数和Q函数 Actor-critic(演员-评论家):使用当前策略去估计值函数和Q函数来改进策略 基于模型:估计转换模型,接着 1.让该模型去规划不明确的策略 2.让该模型去改进策略 3. ...
分类:其他好文   时间:2020-02-04 12:16:47    阅读次数:71
【强化学习】马尔可夫决策过程(MDP)基本原理
\1. 马尔可夫模型的几类子模型 大家应该还记得马尔科夫链(Markov Chain),了解机器学习的也都知道隐马尔可夫模型(Hidden Markov Model,HMM)。它们具有的一个共同性质就是马尔可夫性(无后效性),也就是指系统的下个状态只与当前状态信息有关,而与更早之前的状态无关。 马尔 ...
分类:其他好文   时间:2020-02-03 13:37:17    阅读次数:120
Introduction
1. 模式识别是利用算法自动挖掘数据中的 Knowledge ,进而根据这些知识 采取行动 。 2. 无监督学习问题的目标是发现数据中的相似样本组群,或确定输入空间中数据的分布(密度估计),或从高维投影数据。 3. 强化学习就是要在给定情境下采取合适的措施最大化奖励。强化学习的一般特性就是权衡 ex ...
分类:其他好文   时间:2020-02-03 09:32:26    阅读次数:87
[ 周计划 ] 2.3 ~ 2.9
Pytorch 知识点 1. RNN 2. AutoEncoder 3. DQN 4. DQN强化学习 5. 生成对抗网络 视频 1. 莫烦Pytorch 2. 李宏毅 Lecture15 ~ Lecture20 剑指offer 每天三道 要在考试前结束啊... 1. leetcode实现 / xc ...
分类:其他好文   时间:2020-02-02 23:44:44    阅读次数:80
1.1.1:机器学习课程介绍
机器学习介绍 机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习,改善具体算法的性能。 多领域交叉,涉及概率论、统计学、算法复杂度等多门学科。 分类:监督学习、无监督学习、强化学习(增强学习)、半监督学习、深度学习。 scikit-learn库介绍(sklearn) 依赖Num ...
分类:其他好文   时间:2020-02-02 20:03:57    阅读次数:83
预备知识
1、人工智能案例 AlphaGo 计算机博弈【蒙特卡洛树、深度学习、强化学习、深度卷积神经网络】 语音识别 计算机视觉、图像识别、图像处理【艺术风格转换、性别转换、自动填色、增强分辨率、图像移植、图像修复】 机器人、九歌、人工智能解说、医学诊断【Waston】、智能交通、无人驾驶 弱人工智能、强人工 ...
分类:其他好文   时间:2020-01-31 00:39:40    阅读次数:84
【强化学习RL】model-free的prediction和control — MC, TD(λ), SARSA, Q-learning等
本系列强化学习内容来源自对David Silver课程的学习 课程链接http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html 本文介绍了在model-free情况下(即不知道回报Rs和状态转移矩阵Pss'),如何进行prediction,即 ...
分类:其他好文   时间:2020-01-26 14:24:38    阅读次数:87
328条   上一页 1 ... 6 7 8 9 10 ... 33 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!