Unleashing Your True PotentialIt’s easy to let life’s challenges sap your energy, dissipate your motivation and give you a pessimistic outlook, but th ...
分类:
其他好文 时间:
2019-05-15 09:59:15
阅读次数:
145
去年,OpenAI和DeepMind联手做了当时最酷的实验,不用经典的奖励信号来训练智能体,而是根据人类反馈进行强化学习的新方法。有篇博客专门讲了这个实验 Learning from Human Preferences,原始论文是《 Deep Reinforcement Learning from ...
分类:
其他好文 时间:
2019-05-14 09:45:05
阅读次数:
133
为了让它更具体一些,让我们回去看看MNIST例子的过程。首先,我们下载了MNIST的数据包; (略) 下一步,我们展示了张量train_images的轴的数量,ndim属性: (略) 这是它的shape: (略) 并且这是它的数据类型,dtype属性: (略) 所以我们有了一个8位int的3D张量。 ...
分类:
编程语言 时间:
2019-05-13 16:32:21
阅读次数:
132
前几天面试的时候被问到RL一些基础算法的区别,回来抽空做了一些整理方便加深理解。 On policy与off policy 为了解决强化学习中探索与利用的平衡问题,可以采用两个策略训练模型,一个策略为行为策略,用于保持探索性,提供多样化的数据,不断优化另一个策略(目标策略)。 on policy的目 ...
分类:
其他好文 时间:
2019-05-13 14:29:47
阅读次数:
157
42028: Assignment 2 – Autumn 2019 Page 1 of 4Faculty of Engineering and Information TechnologySchool of Software42028: Deep Learning and Convolutional ...
分类:
其他好文 时间:
2019-05-12 19:51:54
阅读次数:
127
针对回归训练卷积神经网络 此示例使用: Image Processing Toolbox Deep Learning Toolbox Statistics and Machine Learning Toolbox Try it in MATLAB 此示例使用: Image Processing To ...
分类:
其他好文 时间:
2019-05-10 14:58:37
阅读次数:
361
摘自: https://pengfoo.com/post/machine-learning/2017-01-24 一、简介 在ARMA/ARIMA这样的自回归模型中,模型对时间序列数据的平稳是有要求的,因此,需要对数据或者数据的n阶差分进行平稳检验,而一种常见的方法就是ADF检验,即单位根检验 二、 ...
分类:
其他好文 时间:
2019-05-08 14:40:00
阅读次数:
752
Project 1 - A Process SchedulerCO004 Projects on Operating SystemsMarch 1, 2019Due Date for Grouping: Mar. 21, 2019Due Date for Phase 1: Apr. 04, 2019 ...
分类:
其他好文 时间:
2019-05-06 19:30:12
阅读次数:
142
Linux Learning 介绍 该贴记录本菜鸟学习Linux的艰辛过程,因为水平有限,如有有误之处,希望大家不吝指教,谢谢! 相关源码已上传至Github,欢迎访问。 "Mered1th Wang/Linux Learing" [TOC] Linux系统编程 "Linux系统编程——VIM编辑器 ...
分类:
系统相关 时间:
2019-05-02 23:07:56
阅读次数:
221
Machine Learning System introduction This project is a full stack Django/React/Redux app that uses token based authentication with Knox. Then I add Ma ...
分类:
系统相关 时间:
2019-05-01 22:39:35
阅读次数:
166