如何评价模型的好坏（三）

时间：2019-02-14 00:21:48 阅读：327 评论：0 收藏：0 [点我收藏+]

二分类问题
多分类问题
连续变量问题

四、连续变量问题（回归）

（1）距离

（2）残差

（3）残差平方和（SSE）： 真实值与预测值之间误差的平方和。

（3-1）均方根误差（MSE = mean square error）：真实值与预测值之间误差的平方和的均值。（最小二乘）

1 from sklearn.metrics import mean_squared_error
2 y_true =  [1，3, -0.3, 2, 7，5]
3 y_pred = [0.8，2.5, 0.0, 2, 8, 5.1]
4 mean_squared_error(y_true, y_pred)

均方差越小越好，即最小二乘法。

（4）回归平方和（SSR）： 预测值与样本平均值之间误差的平方和。

（5）总偏差平方和（SST）： 真实值与样本平均值之间误差的平方和。

　　经计算推到，SST = SSE + SSR

（5-1）平均绝对误差（MAE = mean absolute error）：真实值与样本平均值之间误差的平方和的均值。

1 from sklearn.metrics import mean_squared_error
2 y_true = [1, 3, -0.3, 2, 7, 5]
3 y_pred = [0.8, 2.5, 0.0, 2, 8, 5.1]
4 mean_squared_error(y_true, y_pred)

（6）R²（r2_score）：样本的总偏差平方和中，被回归平方和解释的百分比。 R² = SSR/SST = 1-SSE/SSR （R²值越大，模型效果越好）

技术图片

1 from sklearn.metrics import r2_score
2 y_true = [1, 3, -0.3, 2, 7, 5]
3 y_pred = [0.8, 2.5, 0.0, 2, 8, 5.1]
4 r2_score(y_true, y_pred)

R²越接近1，模型拟合效果越好。
R²越接近0，模型拟合效果越差。
缺点：数据集越大，R² 越大。因此，不同数据集对同一模型进行测试时，所得的R²不一定相同。

（7）中值绝对误差（median_absolute_error）

技术图片

1 from sklearn.metrics import median_absolute_error
2 y_true = [1, 3, -0.3, 2, 7, 5]
3 y_pred = [0.8, 2.5, 0.0, 2, 8, 5.1]
4 median_absolute_error(y_true, y_pred)

总结：

以上几个指标全部依赖于数据集，当数据集发生变化时，值也随之发生变化。

如何评价模型的好坏（三）

标签：样本 bsp ssr 最小残差 ima 指标 com 相同

原文地址：https://www.cnblogs.com/xdliyin/p/10372232.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行