1. Tippy.js background: linear-gradient(91deg,#f1eefc,#9dc6ff 70%,#a5bcff);(body背景色) background: linear-gradient(135deg,#56c8ff,#6f99fc) no-repeat;(bu ...
分类:
Web程序 时间:
2018-11-30 20:19:27
阅读次数:
972
指数衰减率先用较大的学习率快速迭代,得到一个较优的解。然后,指数衰减法生效,随着迭代的继续逐步减少学习率,这样,可以得到更稳定的解。decayed_learning_rate=learning_rate*decay_rate^(global_step/decay_steps)decay_rate衰减系数decay_steps衰减速度当staircase为True,则global_step/deca
分类:
其他好文 时间:
2018-11-25 21:18:00
阅读次数:
189
原理 梯度下降是一个很常见的通过迭代求解函数极值的方法,当函数非常复杂,通过求导寻找极值很困难时可以通过梯度下降法求解。梯度下降法流程如下: ![image.png 10.8kB][1] 上图中,用大写字母表示向量,用小写字母表示标量。 假设某人想入坑,他站在某点,他每移动一小步,都朝着他所在点的梯 ...
分类:
其他好文 时间:
2018-11-25 13:23:24
阅读次数:
206
一.前言 之前我们讨论的所有问题都是先学习action value,再根据action value 来选择action(无论是根据greedy policy选择使得action value 最大的action,还是根据ε-greedy policy以1-ε的概率选择使得action value 最大 ...
分类:
其他好文 时间:
2018-11-17 16:01:12
阅读次数:
430
近期在搞论文,须要用梯度下降算法求解,所以又一次整理分享在这里。主要包含梯度介绍、公式求导、学习速率选择、代码实现。 梯度下降的性质: 1.求得的解和选取的初始点有关 2.能够保证找到局部最优解,由于梯度终于会减小为0,则步长与梯度的乘积会自己主动越来越小。 梯度简单介绍 一个多元函数的在某点的梯度 ...
分类:
编程语言 时间:
2018-11-07 20:13:39
阅读次数:
291
背包问题 贪心算法 一 问题描述 二 问题分析 **三 代码实现 package knapsnap; import java.io.BufferedWriter; import java.io.FileWriter; import java.io.IOException; import java.u ...
分类:
其他好文 时间:
2018-11-07 14:06:28
阅读次数:
156
.swiper-animate { position: absolute; width: 100%; height: 100%; left: 0; top: 0; z-index: 10; background: linear-gradient(to bottom, transparent, #3e... ...
分类:
Web程序 时间:
2018-11-03 15:28:38
阅读次数:
976
我原来已经安装了anaconda,在此基础上进入cmd进行pip install tensorflow和pip install gym就可以了. 在win10的pycharm做的。 policy_gradient.py play.py 启动训练: 会报一些警告,不用理会,训练到奖励大概有300分的时 ...
分类:
其他好文 时间:
2018-11-01 11:43:49
阅读次数:
222
Training a Neural Network Randomly initialize the weights Implement forward propagation to get hΘ?(x(i)) for any x(i) Implement the cost function Impl ...
分类:
其他好文 时间:
2018-10-29 22:59:35
阅读次数:
232
Week 2 Gradient Descent for Multiple Variables 【1】多变量线性模型 代价函数 Answer:AB 【2】Feature Scaling 特征缩放 Answer:D 【】 Answer: 【】 Answer: 【】 Answer: 【】 Answer: ...
分类:
其他好文 时间:
2018-10-28 19:34:11
阅读次数:
186