码迷,mamicode.com
首页 >  
搜索关键字:强化学习    ( 328个结果
机器学习概述
学习资料:《统计学习方法第二版》第一章 一. 机器学习定义 机器学习就是计算机能够利用数据和统计方法提高系统性能的方法。 二. 机器学习分类 机器学习一般可以分为监督学习、无监督学习、半监督学习和强化学习。 三. 机器学习方法三要素 模型+策略+优化算法=机器学习方法 模型 在监督学习中模型就是要学 ...
分类:其他好文   时间:2020-04-10 19:48:53    阅读次数:73
强化学习中的重要概念
Action Space(行为空间) 定义:在所在环境中所有有效的行为的集合叫行为空间。 一些环境是有离散的行为,对于agent来说是有限的行为,如Atari游戏、Alpha Go。 其他的环境是有连续的行为,如在真实世界的机器人的控制角度等。 Policy(策略) 定义:策略是一种被agent使用 ...
分类:其他好文   时间:2020-04-05 18:40:34    阅读次数:98
机器学习概述1
(1) (2) (3) 按照学习形式将机器学习划分为监督学习、无监督学习、半监督学习、强化学习、深度学习 监督学习(Supervised Learning)表示机器学习的数据是带标记的,这些标记可以包括数据类别、数据属性及特征点位置等。这些标记作为预期效果,不断修正机器的预测结果。 无监督学习(Un ...
分类:其他好文   时间:2020-04-05 11:19:12    阅读次数:68
机器学习--1
机器学习的核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测” 监督学习,无监督学习,强化学习 比如说无人驾驶,里面涉及了强化学习,通过“奖励”和“惩罚”的方式进行引导机器对目标任务的完成。 整体,我复习了一遍高数的微积分,各种导数,各种定理,概率论各种理论。 ...
分类:其他好文   时间:2020-04-02 11:47:21    阅读次数:110
【深度强化学习】Curriculum-guided Hindsight Experience Replay读后感
[TOC] 导读 看任何一个领域的文章,一定要看第一手资料。学习他们的思考方式,论述逻辑,得出一点自己的感悟。因此,通过阅读paper,来提升自己对于这个领域的感性和理性认识。如少年时,玩war3电子竞技一般。理解各个种族,最后突破一点 ,狂练一个种族,找寻突破点。 文章原文:https://ai. ...
分类:其他好文   时间:2020-04-02 11:44:44    阅读次数:88
强化学习基本概念
智能体(agent) 例如alpha-go中的棋盘,用于产生动作的主体就是智能体。 状态(state) l例如当前棋盘中的局势就是状态,表示的是主体执行动作之前需要考虑的外部环境 动作(action) 例如下围棋中的落子,表示智能体在某个状态下采取的一个行为 奖励(reward) 例如当某一步有利于 ...
分类:其他好文   时间:2020-04-02 01:14:19    阅读次数:92
告别炼丹,Google Brain提出强化学习助力Neural Architecture Search | ICLR2017
论文为Google Brain在16年推出的使用强化学习的Neural Architecture Search方法,该方法能够针对数据集搜索构建特定的网络,但需要800卡训练一个月时间。虽然论文的思路有很多改进的地方,但该论文为AutoML的经典之作,为后面很多的研究提供了思路,属于里程碑式的论文, ...
分类:其他好文   时间:2020-03-27 12:42:46    阅读次数:87
【华为云技术分享】华为开发者大会HDC.Cloud带你探索强化学习三大挑战及落地实践
2015-2017年间,AlphaGo系列事件宣告在围棋领域AI算法战胜人类世界冠军,这主要得益于其背后的核心技术-深度强化学习技术。之后研究者开始转向更加复杂的对战博弈场景,典型例子如Deepmind星际下AlphaStar,和OpenAI dota 下的OpenAi Five,并且均表现出接近甚 ...
分类:其他好文   时间:2020-03-19 13:59:49    阅读次数:90
统计学习方法——机器学习概论
简介 统计学习,或者说机器学习的方法主要由监督学习、无监督学习和强化学习组成(它们是并列的,都属于统计学习方法)。 统计学习方法要素 1、假设数据独立同分布。(同数据源的不同样本之间相互独立) 2*、假设要学习的模型属于某个函数的集合,称为假设空间。(你确定了这个函数的样式,就是假设空间,但是函数里 ...
分类:其他好文   时间:2020-03-18 20:20:51    阅读次数:103
科普 | 强化学习技术及应用
导读 从一开始的AlphaGo击败世界冠军、到今天的自然语言处理、自动驾驶等,这与机器学习之强化学习算法息息相关。这股技术热浪也在逐年上升中。本文通俗语言简洁强化学习原理,马尔科夫过程,以及深度强化学习的应用。 概论 随着近些年人工智能领域的发展,机器学习技术被分为监督学习、无监督学习和强化学习三大 ...
分类:其他好文   时间:2020-03-17 14:06:39    阅读次数:77
328条   上一页 1 ... 4 5 6 7 8 ... 33 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!