标签:增量 原因 理解 现在 这一 for tin 用户 根据
下面这一段节选自知乎用户,具体链接为:https://www.zhihu.com/question/27068705/answer/82132134。
在机器学习过程中,我们用训练数据集去训练(学习)一个model(模型),通常的做法是定义一个Loss function(误差函数),通过将这个Loss(或者叫error)的最小化过程,来提高模型的性能(performance)。然而我们学习一个模型的目的是为了解决实际的问题(或者说是训练数据集这个领域(field)中的一般化问题),单纯地将训练数据集的loss最小化,并不能保证在解决更一般的问题时模型仍然是最优,甚至不能保证模型是可用的。这个训练数据集的loss与一般化的数据集的loss之间的差异就叫做generalization error。而generalization error又可以细分为Bias和Variance两个部分。
Bias是 “用所有可能的训练数据集训练出的所有模型的输出的平均值” 与 “真实模型”的输出值之间的差异;
Variance则是“不同的训练数据集训练出的模型”的输出值之间的差异。
偏差与方差分别是用于衡量一个模型泛化误差的两个方面;
在监督学习中,模型的泛化误差可分解为偏差、方差与噪声之和。
偏差用于描述模型的拟合能力;
方差用于描述模型的稳定性。
准:bias描述的是根据样本拟合出的模型的输出预测结果的期望与样本真实结果的差距,简单讲,就是在样本上拟合的好不好。要想在bias上表现好,low bias,就得复杂化模型,增加模型的参数,但这样容易过拟合(overfitting),过拟合对应上图是high variance,点很分散。low bias对应就是点都打在靶心附近,所以瞄的是准的,但手不一定稳。
确:variance描述的是样本上训练出来的模型在测试集上的表现,要想在variance上表现好,low variance,就要简化模型,减少模型的参数,但这样容易欠拟合(unfitting),欠拟合对应上图是high bias,点偏离中心。low variance对应就是点打的很集中,但不一定是靶心附近,手很稳,但是瞄的不准。
简单理解,高偏差可能就是欠拟合了,高方差就是过拟合了。要选择一个适中的情况。
给定学习任务,
偏差和方差的关系和模型容量(模型复杂度)、欠拟合和过拟合的概念紧密相联
标签:增量 原因 理解 现在 这一 for tin 用户 根据
原文地址:https://www.cnblogs.com/Vancuicide/p/9635382.html