搜索关键字：强化学习，搜索到328个结果！码迷,mamicode.com！

机器学习概述

学习资料：《统计学习方法第二版》第一章一. 机器学习定义机器学习就是计算机能够利用数据和统计方法提高系统性能的方法。二. 机器学习分类机器学习一般可以分为监督学习、无监督学习、半监督学习和强化学习。三. 机器学习方法三要素模型+策略+优化算法=机器学习方法模型在监督学习中模型就是要学 ...

分类：其他好文时间：2020-04-10 19:48:53 阅读次数：73

强化学习中的重要概念

Action Space（行为空间）定义：在所在环境中所有有效的行为的集合叫行为空间。一些环境是有离散的行为，对于agent来说是有限的行为，如Atari游戏、Alpha Go。其他的环境是有连续的行为，如在真实世界的机器人的控制角度等。 Policy（策略）定义：策略是一种被agent使用 ...

分类：其他好文时间：2020-04-05 18:40:34 阅读次数：98

机器学习概述1

(1) (2) (3) 按照学习形式将机器学习划分为监督学习、无监督学习、半监督学习、强化学习、深度学习监督学习（Supervised Learning）表示机器学习的数据是带标记的，这些标记可以包括数据类别、数据属性及特征点位置等。这些标记作为预期效果，不断修正机器的预测结果。无监督学习（Un ...

分类：其他好文时间：2020-04-05 11:19:12 阅读次数：68

机器学习--1

机器学习的核心是“使用算法解析数据，从中学习，然后对世界上的某件事情做出决定或预测” 监督学习，无监督学习，强化学习比如说无人驾驶，里面涉及了强化学习，通过“奖励”和“惩罚”的方式进行引导机器对目标任务的完成。整体，我复习了一遍高数的微积分，各种导数，各种定理，概率论各种理论。 ...

分类：其他好文时间：2020-04-02 11:47:21 阅读次数：110

【深度强化学习】Curriculum-guided Hindsight Experience Replay读后感

[TOC] 导读看任何一个领域的文章，一定要看第一手资料。学习他们的思考方式，论述逻辑，得出一点自己的感悟。因此，通过阅读paper,来提升自己对于这个领域的感性和理性认识。如少年时，玩war3电子竞技一般。理解各个种族，最后突破一点 ,狂练一个种族，找寻突破点。文章原文:https://ai. ...

分类：其他好文时间：2020-04-02 11:44:44 阅读次数：88

强化学习基本概念

智能体（agent）例如alpha-go中的棋盘，用于产生动作的主体就是智能体。状态（state） l例如当前棋盘中的局势就是状态，表示的是主体执行动作之前需要考虑的外部环境动作（action）例如下围棋中的落子，表示智能体在某个状态下采取的一个行为奖励（reward）例如当某一步有利于 ...

分类：其他好文时间：2020-04-02 01:14:19 阅读次数：92

告别炼丹，Google Brain提出强化学习助力Neural Architecture Search | ICLR2017

论文为Google Brain在16年推出的使用强化学习的Neural Architecture Search方法，该方法能够针对数据集搜索构建特定的网络，但需要800卡训练一个月时间。虽然论文的思路有很多改进的地方，但该论文为AutoML的经典之作，为后面很多的研究提供了思路，属于里程碑式的论文， ...

分类：其他好文时间：2020-03-27 12:42:46 阅读次数：87

【华为云技术分享】华为开发者大会HDC.Cloud带你探索强化学习三大挑战及落地实践

2015-2017年间，AlphaGo系列事件宣告在围棋领域AI算法战胜人类世界冠军，这主要得益于其背后的核心技术-深度强化学习技术。之后研究者开始转向更加复杂的对战博弈场景，典型例子如Deepmind星际下AlphaStar，和OpenAI dota 下的OpenAi Five，并且均表现出接近甚 ...

分类：其他好文时间：2020-03-19 13:59:49 阅读次数：90

统计学习方法——机器学习概论

简介统计学习，或者说机器学习的方法主要由监督学习、无监督学习和强化学习组成（它们是并列的，都属于统计学习方法）。统计学习方法要素 1、假设数据独立同分布。（同数据源的不同样本之间相互独立） 2*、假设要学习的模型属于某个函数的集合，称为假设空间。（你确定了这个函数的样式，就是假设空间，但是函数里 ...

分类：其他好文时间：2020-03-18 20:20:51 阅读次数：103

科普 | 强化学习技术及应用

导读从一开始的AlphaGo击败世界冠军、到今天的自然语言处理、自动驾驶等，这与机器学习之强化学习算法息息相关。这股技术热浪也在逐年上升中。本文通俗语言简洁强化学习原理，马尔科夫过程，以及深度强化学习的应用。概论随着近些年人工智能领域的发展，机器学习技术被分为监督学习、无监督学习和强化学习三大 ...

分类：其他好文时间：2020-03-17 14:06:39 阅读次数：77

共328条上一页 1 ... 4 5 6 7 8 ... 33 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)