NEAT算法

时间：2018-09-30 18:16:12 阅读：382 评论：0 收藏：0 [点我收藏+]

NEAT算法是相对提出较早的算法，在2013年大名鼎鼎的DeepMind提出了一种深度增强学习的算法，该算法主要结合的CNN和Q-Learning两种算法，本质利用遗传算法创建神经网络

1、RL:增强学习

奖赏假设：

任务的目标可以等价的表示为在某个奖赏函数上的累积最大化

马尔可夫性：当一个随机过程在给定现在状态及所有过去状态情况下，其未来状态的条件概率分布仅依赖于当前状态；换句话说，在给定现在状态时，它与过去状态（即该过程的历史路径）是条件独立的，那么此随机过程即具有马尔可夫性质。具有马尔可夫性质的过程通常称之为马尔可夫过程。

技术分享图片

（2）Q学习

基本迭代：

技术分享图片

2、NEAT算法即通过增强拓扑的进化神经网络（Evolving Neural Networks through Augmenting Topologies），算法不同于我们之前讨论的传统神经网络，它不仅会训练和修改网络的权值，同时会修改网络的拓扑结构，包括新增节点和删除节点等操作。

NEAT算法几个核心的概念是：

下图我们展示了算法从最一开始简单的神经网络，一直训练到后期的网络

技术分享图片

原文地址：https://www.cnblogs.com/6530265oule/p/9732578.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行