机器学习包含监督学习、非监督学习、以及强化学习三大部分。 监督学习分为分类和回归两大类。 分类:例如 经过大量水果图片训练,识别新水果图片中是否含有苹果 回归:例如 经过大量 面积-房价 的数据的训练,预测某个面积的房价 回归分析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性 ...
分类:
其他好文 时间:
2018-11-25 22:16:19
阅读次数:
241
机器学习 监督学习 非监督学习 半监督学习 强化学习 遗传算法 神经网络 CNN TensorFlow搭建CNN 展开源码 展开源码 RNN 展开源码 展开源码 LSTM 为了解决梯度弥散和梯度爆炸 展开源码 展开源码 自编码器 autoencoder 展开源码 展开源码 GAN 展开源码 展开源码 ...
分类:
其他好文 时间:
2018-11-24 22:25:22
阅读次数:
219
深度学习是机器学习的一种,深度学习是实现机器学习算法的技术,深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。 深度学习算法有卷积神经网络(cnn),循环神经网络(rnn)等,卷积神经网络用于图像处理较多,循环神经网络则处理不定长度的数据。 深度学习结合强化学习为深度强 ...
分类:
其他好文 时间:
2018-11-23 22:30:07
阅读次数:
232
资源链接:https://pan.baidu.com/s/1y6Fl0zUymMySZZhmBToy2Q《深入浅出强化学习:原理入门》高清PDF+源代码高清PDF,284页,带书签目录,彩色配图,文字可以复制。配套源代码。《深入浅出强化学习:原理入门》,作者:郭宪/方勇纯,用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。高清PDF如
分类:
其他好文 时间:
2018-11-22 00:16:38
阅读次数:
376
下载:https://pan.baidu.com/s/1RQvGYYbIkc3ob3jB6AAu0Q 更多分享资料:https://www.cnblogs.com/javapythonstudy/ 《深入浅出强化学习:原理入门》高清PDF+源代码高清PDF,284页,带书签目录,彩色配图,文字可以复 ...
分类:
其他好文 时间:
2018-11-21 01:06:17
阅读次数:
2156
下载:https://pan.baidu.com/s/1RQvGYYbIkc3ob3jB6AAu0Q更多资料分享:http://blog.51cto.com/3215120《深入浅出强化学习:原理入门》高清PDF+源代码高清PDF,284页,带书签目录,彩色配图,文字可以复制。配套源代码。《深入浅出强化学习:原理入门》,作者:郭宪/方勇纯,用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了
分类:
其他好文 时间:
2018-11-21 01:06:03
阅读次数:
233
一.前言 之前我们讨论的所有问题都是先学习action value,再根据action value 来选择action(无论是根据greedy policy选择使得action value 最大的action,还是根据ε-greedy policy以1-ε的概率选择使得action value 最大 ...
分类:
其他好文 时间:
2018-11-17 16:01:12
阅读次数:
430
什么是 DQN 今天我们会来说说强化学习中的一种强大武器, Deep Q Network 简称为 DQN. Google Deep mind 团队就是靠着这 DQN 使计算机玩电动玩得比我们还厉害. 强化学习与神经网络 之前我们所谈论到的强化学习方法都是比较传统的方式, 而如今, 随着机器学习在日常 ...
分类:
其他好文 时间:
2018-11-17 14:27:55
阅读次数:
189
Gym是一个开发和比较强化学习算法的工具包。它对代理的结构不做任何假设,并且与任何数值计算库(如TensorFlow或Theano)兼容。1.安装好Gym和baselines2.这个任务是在[Dietterich2000]中介绍的,以说明分层强化学习中的一些问题。有4个地点(用不同的字母标注),你的工作是在一个地点接乘客,在另一个地点下车。如果你成功的停留了,你会得到+20分,并且在每次停留的时候
分类:
其他好文 时间:
2018-11-15 17:08:33
阅读次数:
156
原文链接:https://riboseyim.github.io/2018/02/10/Machine Learning Algorithms/ 摘要 机器学习算法分类:监督学习、半监督学习、无监督学习、强化学习 基本的机器学习算法:线性回归、支持向量机(SVM)、最近邻居(KNN)、逻辑回归、决策 ...
分类:
编程语言 时间:
2018-11-15 12:02:21
阅读次数:
166