使用策略梯度解决离散action space问题。 一、导入包,定义hyper parameter 二、PolicyGradient Agent的构造函数: 1、设置问题的状态空间维度,动作空间维度; 2、序列采样的存储结构; 3、调用创建用于策略函数近似的神经网络的函数,tensorflow的se ...
分类:
其他好文 时间:
2019-05-26 18:04:54
阅读次数:
137
"我们只是大佬的搬运工" 1、log loss 2、WBE loss 带权重的交叉熵 3、Focal loss 容易过拟合?不知why 4、DIce loss 对于肿块太小的梯度容易变化剧烈 5、IOU loss 6、Tversky loss 7、敏感性 特异性损失 8、Generalized Di ...
分类:
其他好文 时间:
2019-05-22 19:02:17
阅读次数:
101
[TOC] Momentum Momentum的迭代公式为: $$ v_t = \gamma v_{t 1} + \eta \nabla_\theta J(\theta) \\ \theta=\theta v_t $$ 其中$J(\cdot)$一般为损失函数。我们知道,一般的梯度下降,是没有$\ga ...
分类:
其他好文 时间:
2019-05-19 11:52:22
阅读次数:
135
第九章 推荐系统算法详解9.1 常用推荐算法分类9.1.1 基于人口统计学的推荐与用户画像9.1.2 基于内容的推荐与特征方程9.1.3 基于协同过滤的推荐 第九章 推荐系统算法详解 9.1 常用推荐算法分类 9.1.1 基于人口统计学的推荐与用户画像 9.1.2 基于内容的推荐与特征方程 特征按照 ...
分类:
编程语言 时间:
2019-05-18 09:36:24
阅读次数:
187
有监督学习--简单线性回归模型(梯度下降法代码实现)0.引入依赖1.导入数据(data.csv)2.定义损失函数3.定义模型的超参数4.定义核心梯度下降模型函数5.测试:运行梯度下降算法,计算最优的 w 和 b6.画出拟合曲线7.附录-测试数据 有监督学习--简单线性回归模型(梯度下降法代码实现) ...
分类:
其他好文 时间:
2019-05-18 09:35:15
阅读次数:
135
LFM--梯度下降法--实现基于模型的协同过滤0.引入依赖1.数据准备2.算法的实现3.测试 LFM--梯度下降法--实现基于模型的协同过滤 0.引入依赖 import numpy as np # 数值计算、矩阵运算、向量运算import pandas as pd # 数值分析、科学计算 1.数据准 ...
分类:
其他好文 时间:
2019-05-18 09:26:56
阅读次数:
165
逻辑回归模型是针对线性可分问题的一种易于实现而且性能优异的分类模型。 它假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降法来求解参数,来达到将数据二分类的目的。 算法推导 引入几率比(odds):指一个事件发生的概率与不发生概率的比值。对其求log,可得: $$ logit(p) = ...
分类:
其他好文 时间:
2019-05-15 16:08:09
阅读次数:
178
3.1 基本形式 给定由$d$个属性描述的示例$x=(x_{1};x_{2};...;x_{d})$,其中$x_{i}$是$x$在第$i$个属性上的取值,线性模型学习一个属性的线性组合来预测函数,即$$f(x)=w_{1}x_{1}+w_{2}x_{2}+...+w_{d}x_{d}+b(3.1)$ ...
分类:
其他好文 时间:
2019-05-14 11:22:53
阅读次数:
132
内核移植的梯度: 初级:根据芯片公司的参考配置,编译开发板内核并了解执行过程 中极:添加内核驱动的方式方法 高级:修改或添加BSP包 linux内核特性: 可移植性强、支持的硬件平台广泛;超强的网络功能;多任务多用户系统;模块化的设计 五大子系统: 进程管理;内存管理;文件系统;网络协议;设备管理 ...
分类:
系统相关 时间:
2019-05-11 23:24:40
阅读次数:
267
http://www.cnblogs.com/infaraway/p/8523341.html 卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。 其中 文章 详解卷积神 ...
分类:
Web程序 时间:
2019-05-06 17:31:19
阅读次数:
232