码迷,mamicode.com
首页 >  
搜索关键字:强化学习    ( 328个结果
DQN
Deep Q-learning Network 参考资料: Q_learning论文 "Playing Atari with Deep Reinforcement Learning" https://arxiv.org/abs/1312.5602 李宏毅"强化学习教程" http://speech. ...
分类:其他好文   时间:2019-12-26 16:02:30    阅读次数:160
一文让你看懂人工智能、机器学习、深度学习和强化学习的关系
基本概念:人工智能,机器学习,深度学习,强化学习的区别和简介 机器学习(Machine Learning)是实现人工智能的一种手段.也是目前被认为比较有效的实现人工智能的手段.目前在业界使用机器学习比较突出的领域很多,例如计算机视觉,自然语言处理,推荐系统,文本分等,大家生活中经常用到的比如高速上E ...
分类:其他好文   时间:2019-12-20 20:57:56    阅读次数:149
StartDT AI Lab | 数据增强技术如何实现场景落地与业务增值?
有人说,「深度学习“等于”深度卷积神经网络算法模型+大规模数据+云端分布式算力」。也有人说,「能够在业内叱咤风云的AI都曾“身经百战”,经历过无数次的训练与试错」。以上都需要海量数据做依托,对于那些数据量匮乏的领域,就衍生出了数据增强技术。即,根据一个原始数据,稍作改动,变成一个对于AI来说的全新的 ...
分类:其他好文   时间:2019-12-18 22:10:26    阅读次数:119
强化学习环境OpenAi搭建,从虚拟机到Gym、Mujoco和mujoco-py的完整安装
平时不怎么写博客,这次是因为环境的配置花费了我大概一个星期的时间。所以简单的记录一下搭建的整个过程,其中有些部分我直接推荐别人的博客的基本教程,都是我亲自尝试过成功的。同时,也希望这篇博客可以帮到您。 (一)VMware Wokestation Pro15安装CENTOS7和Ubuntu版本Linu ...
分类:其他好文   时间:2019-12-15 16:14:40    阅读次数:233
【强化学习】DQN 算法改进
DQN 算法改进 (一)Dueling DQN Dueling DQN 是一种基于 DQN 的改进算法。主要突破点:利用模型结构将值函数表示成更加细致的形式,这使得模型能够拥有更好的表现。下面给出公式,并定义一个新的变量: $$ q(s_t, a_t)=v(s_t)+A(s_t, a_t) $$ 也 ...
分类:编程语言   时间:2019-12-13 13:38:11    阅读次数:175
SIGAI机器学习第四集 基本概念
大纲: 算法分类有监督学习与无监督学习分类问题与回归问题生成模型与判别模型强化学习评价指标准确率与回归误差ROC曲线交叉验证模型选择过拟合与欠拟合偏差与方差正则化 半监督学习归类到有监督学习中去。 有监督学习大部分问题都是分类问题,有监督中的分类问题分为生成式模型和判别模型。 分类问题常用的评价指标 ...
分类:其他好文   时间:2019-11-30 18:55:39    阅读次数:98
深度学习优质学习项目大放送!-AI Studio精选开源项目合集推荐
近期 在 AI Studio 上发现了不少优质的开源深度学习项目,从深度学习入门到进阶,涵盖了 CV 、 NLP 、生成对抗网络、强化学习多个研究方向,还有最新的动态图,都以 NoteBook 的方式直接开源出来,并且 AI Studio 还提供了免费算力,可直接在线运行跑训练任务,推荐深度学习开发... ...
分类:其他好文   时间:2019-11-29 18:24:59    阅读次数:87
Paper | SkipNet: Learning Dynamic Routing in Convolutional Networks
[toc] 作者对residual network进行了改进:加入了gating network,基于上一层的激活值,得到一个二进制的决策0或1,从而继续推断或跳过下一个block。作者还提出了对应的训练方法,集成有监督学习和强化学习,从而克服了skipping不可差分的问题。 1. 概括 难点:s ...
分类:Web程序   时间:2019-11-25 23:25:51    阅读次数:100
强化学习——将会颠覆机器学习还是一套小家子主意
有这样一种situation——我们需要根据此时的环境做出相应的行动,aim在于实现预期目标。 situation可以这样表示: for(iter=START;iter!=END;iter++) #某个时间段 f(observation) #根据此刻观察到的环境采取相应行为 f(x)指的是从“此刻观 ...
分类:其他好文   时间:2019-11-09 19:34:15    阅读次数:94
学习记录
1、9/1~10/31经典算法梳理和学习 1.1 小蓝书(第一遍已学完,等其他知识点完成后,需要再刷一遍) 1.2 西瓜书 (计算学习理论、半监督学习、概率图模型、强化学习、规则学习,课后习题;前面章节尽快完成) 2、19/11/1~20/1/31 自然语言处理基础知识 2.1 数学之美(进行中) ...
分类:其他好文   时间:2019-11-04 11:37:56    阅读次数:97
328条   上一页 1 ... 8 9 10 11 12 ... 33 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!