[What-Why-How] 线性回归预测

时间：2019-12-03 23:17:29 阅读：92 评论：0 收藏：0 [点我收藏+]

What

现有多个变量X₁, X₂, X₃, ....会对结果数据Y产生影响，现在要求出这些变量X_n对于最终结果的影响权重。找到一个线(两个变量)，面(三个变量)来拟合这些权重的数值。通过训练数据得到这些参数，然后使用这些参数(模型)对新数据进行预测

例如，拟合一个平面：

其中 θ₀表示预置的权重参数。

误差

　　真实值和预测值之间肯定是要存在差异的

　　误差是独立并且具有相同分布，并且服从均值为0方差为θ²的高斯分布（正态分布）

　　似然函数：，什么样的参数跟我们的数据组合后恰好时真实值。样本数据 -> 参数，参数估计。最大似然函数，极大似然估计，让结果符合真实值的概率最大。

　　对数似然：，似然函数的对数形式，便于计算。

　　目标函数：，从对数似然化简得出，目标函数值越小似然函数值越大。对目标函数求偏导，在其偏导数为0点的，为极小值点：

评估方法

　　最常用的评估项：R²，其值越接近1认为结果约好。技术图片

梯度下降

　　得到一个目标函数后，如何进行求解。

　　目标函数：，寻找山谷最低点，即函数终点

　　如果有多个参数，是每个参数分布求极值，每次一小点，不断的更新参数

　　梯度下降的方法：

- 　　批量梯度下降

　　　　　　容易得到最优解，但每次要考虑所有样本，速度很慢

- 　　随机梯度下降

　　　　　　每次找一个样本，迭代速度快，但不一定每次朝着收敛的方向

- 　　小批量梯度下降 batch

　　　　　　每次更新选择一小部分数据来计算，较实用

　　不同步长(学习率)对结果会有大影响。一般要小一些，从小值开始，不行再小。批量的大小，在机器资源允许的情况下尽量大些。

Why

How

[What-Why-How] 线性回归预测

标签：似然函数方法最大似然函数 hat 图片开始样本 style 变量

原文地址：https://www.cnblogs.com/vectorli/p/11963192.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

[What-Why-How] 线性回归预测

What

误差

评估方法

梯度下降

批量梯度下降

随机梯度下降

小批量梯度下降 batch

Why

How

　　批量梯度下降

　　随机梯度下降

　　小批量梯度下降 batch