首页 > 其他好文 > 详细

线性回归

时间：2019-07-21 13:24:18 阅读：78 评论：0 收藏：0 [点我收藏+]

标签：方便 block 密度 auto 函数随机梯度 bat 线性解决

1 线性回归的模型

　　线性回归的模型十分的简单，就是对回归问题中每一个特征X乘以一个系数，使其拟合到输出Y，线性回归模型就是找到这样一组系数。

　　线性回归的模型如下：

技术图片

　　其中x是数据的特征，是一个d维的列向量，技术图片是权重系数，也是一个d维的列向量，y是模型的输出

2 线性回归的损失函数

　　在做回归问题的时候，模型的预测输出值和真实值总是存在一个误差技术图片，误差满足均值为0，标准差为的高斯分布，则线性归回的模型变为

技术图片

　　其中技术图片。

　　由于技术图片满足高斯分布，则其概率密度函数为：

技术图片

　　将技术图片带入上式密度函数中，得到：

技术图片

　　上式即为似然函数，为了使模型更好的拟合数据集，需要最大化似然函数：

技术图片

　　其中N使数据集的个数。

　　为了计算方便，对上式取对数：

　　技术图片

　　其中const是一个常数，则最大化上式可等价于下式：

　　技术图片

　　则定义线性回归的损失函数为：

技术图片

3 优化线性回归模型

　　由上一节得到线性归回的损失函数为：

技术图片

　　需要优化的问题是：找到一组技术图片，使上式的损失函数最小，即对损失函数求导：

技术图片　　则参数　可通过迭代求解：

　　技术图片

　　其中技术图片为学习率。

　　上式的迭代算法是批量梯度下降算法(BGD)，每更新一次，需要计算所有样本上的梯度的平均值。

　　下面是随机梯度下降(SGD)，每更新一次，只是从样本数据中随机挑选一个样本来计算梯度值：
技术图片

　　最后一个为小批量随机梯度下降(Mini-Batch GD)，每更新一次，从所有样本中随机挑选一批样本来计算这一批的梯度的平均值：
技术图片

　　其中Nk为小批量的个数。

4 张量视角

　　技术图片

　　其中X为样本，n为样本的个数，d为样本的特征个数，即每一行为一个样本。技术图片是模型的参数，是一个d维的列向量。y是样本的标签，是一个n维的列向量。

　　则，线性回归模型的矩阵形式为：

技术图片

　　线性回归的损失函数的矩阵形式为：

技术图片

　　上式对向量技术图片求梯度，即矩阵对向量求梯度，需要以下矩阵对向量的知识才能得出：

技术图片

　　则可求出J对技术图片的梯度为：

技术图片

　　让上式子等于零，可求出最优的参数技术图片：

技术图片

5 线性回归模型的正则化

　　线性回归模型的正则化可解决两个问题：

　　1 可以解决模型的过拟合问题

　　2 若技术图片奇异，即不可逆，则上节用最小二乘法就求不出解，加入正则化项则可解决这一问题

　　加入L2正则化项的损失函数：

　　技术图片

　　求梯度：

技术图片

　　求解：

技术图片

　　

标签：方便 block 密度 auto 函数随机梯度 bat 线性解决

原文地址：https://www.cnblogs.com/swenwen/p/11220539.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！