个人机器学习总结之线性回归

时间：2019-07-23 15:32:54 阅读：113 评论：0 收藏：0 [点我收藏+]

标签：梯度下降法最小 display 批量随机梯度直接 image 降维比例

1. 线性回归

1.1 算法原理

（1）情景：给定一定数量的数据点，通过拟合得到其回归直线，使得所有点到这个直线的距离之和（损失函数）最小。

技术图片

即：已知各个点的坐标，反求直线表达式的最优系数解。

假定直线参数为θ，则直线表达式为：

技术图片

得到的直线（平面）表达式应使得损失函数最小，其中损失函数表达式：

（2）求解方式：

第一种：直接求解

欲使损失函数最小，对损失函数进行求导等于0（实际问题中极小值即为最小值）

技术图片

第二种：梯度下降法

技术图片

从损失函数上的任一点出发，每次沿梯度的方向更新θ的值，所得到的新的θ将会使损失函数的函数值更小。（属随机梯度下降原理）

求解的关键在于得到其导数的方向，保证每次更新都将沿损失函数值下降的方向，同时要选取适当的学习步长α，避免过快更新超过其最小值的同时尽量选择较大步长来减少迭代更新的次数。

技术图片

上面的所述的思想，是基于每次都代入一个x进行迭代更新，称为随机梯度下降，但由于其方向为单个的导数的方向，所得到的极值点可能为局部最小值（如下图所示），而非整体最小值，想尽可能得到整体最小值，应采用批量梯度下降法，即每次更新均代入所有的X进行更新，其更新的方向为合导数的方向（可以理解为合力与分力的关系，站在更高维度去思考该问题，合力方向与单个方向的不同将使得各个维度的变化量不同）。