分类与预测模型对训练集进行预测而得出的准确率并不能很好地反映预测模型未来的性能,为了有效判断一个预测模型的性能表现,需要一组没有参与预测模型建立的数据集,并在该数据集上评价预测模型的准确率,这组独立的数据集叫做测试集。模型预测效果评价,通常用相对/绝对误差、平均绝对误差、均方误差、均方根误差、平均绝 ...
分类:
编程语言 时间:
2019-09-04 00:14:07
阅读次数:
238
环境Anaconda 废话不多说,关键看代码 部分结果输出: ...
分类:
其他好文 时间:
2019-08-17 00:34:32
阅读次数:
105
降维算法应用:数据压缩、数据可视化。 主成分分析(PCA)是最常见的降维算法。 在 PCA 中,我们要做的是找到一个方向向量(Vector direction),当我们把所有的数据 都投射到该向量上时,我们希望投射平均均方误差能尽可能地小。方向向量是一个经过原点 的向量,而投射误差是从特征向量向该方 ...
分类:
其他好文 时间:
2019-08-16 00:53:54
阅读次数:
145
Q1动机一:数据压缩 将特征进行降维,如将相关的二维降到一维: 三维变二维: 以此类推把1000维数据降成100维数据。减少内存占用的空间 Q2动机二:数据可视化 如50个维度的数据是无法进行可视化的,使用降维的方法可以使其降到2维,然后进行可视化。 降维的算法只负责减少维度,新产生的特征的意义就必 ...
分类:
其他好文 时间:
2019-08-02 13:12:29
阅读次数:
85
一、多元回归分析简介 用回归方程定量地刻画一个应变量与多个自变量间的线性依存关系,称为多元回归分析(multiple linear regression),简称多元回归(multiple regression)。 多元回归分析是多变量分析的基础,也是理解监督类分析方法的入口!实际上大部分学习统计分析 ...
分类:
其他好文 时间:
2019-07-28 22:48:10
阅读次数:
234
1、线性回归 假设线性函数如下: 假设我们有10个样本x1,y1),(x2,y2).....(x10,y10),求解目标就是根据多个样本求解theta0和theta1的最优值。 为了解决这个问题,我们需要引入误差分析预测值与真实值之间的误差为最小。 2、梯度下降算法 梯度下降的场景: 梯度下降法的基 ...
分类:
编程语言 时间:
2019-07-17 18:38:52
阅读次数:
175
性能度量是衡量模型泛化能力的评价标准,模型的好坏是相对的,模型的好坏不仅取决于算法和数据,还决定于任务的需求。 回归任务中常用的性能度量是:均方误差(越小越好),解释方差分(越接近1越好)。 分类任务中常用的性能度量: 1)错误率:分类错误的样本数占样本总数的比例。 2)精度:分类正确的样本数占样本 ...
分类:
其他好文 时间:
2019-07-07 11:10:32
阅读次数:
203
1976年提出了CIELUV和CIELAB两个色彩空间。 CIELAB,它主要利用的是对立色理论。 适合于将数字输入的多样性转化为人类知觉上的差异 CIE1976其实就是均方误差 ...
分类:
其他好文 时间:
2019-06-25 20:55:23
阅读次数:
127
定义:表示神经网络性能的“恶劣程度”的指标,即当前的神经网络对监督数据在多大程度上不拟合,在多大程度上不一致。 均方误差 yk 是表示神经网络的输出,tk 表示监督数据,k 表示数据的维数。 代码实现 交叉熵误差 代码实现: mini-batch使用损失函数 计算损失函数时必须将所有的训练数据作为对 ...
分类:
其他好文 时间:
2019-06-21 12:34:48
阅读次数:
125
import numpy as npdef compute_error_points(b, w, points): total_error = 0 for i in range(0, len(points)): x = points[i, 0] y = points[i, 1] # 计算均方误差 t ...
分类:
其他好文 时间:
2019-06-14 00:53:51
阅读次数:
112