Andrew Ng机器学习（二）：逻辑回归

时间：2018-10-07 15:37:06 阅读：144 评论：0 收藏：0 [点我收藏+]

标签：大于 UNC alpha .net tail 就是 gradient 需要迭代

1.逻辑回归解决什么问题？

逻辑回归用于分类问题。

对于二分类问题，输入多个特征，输出为是或不是（也可以写作1或0）。

逻辑回归就是这样一个用于分类的模型。

2.什么是逻辑回归？

逻辑回归建立在线性回归的基础上。

首先，线性回归将多个特征映射到一个变量技术分享图片。

之后，在这个变量上设置一个阈值。大于这个阈值的判断为是，输出1；小于这个阈值的判断为否，输出0。

也可以不输出1或0，而输出是1的概率，再由概率是否大于0.5判断是或否。

逻辑回归就是这样一个输出是1的概率的模型（Sigmoid函数）：

技术分享图片

对于θ^Tx，判断输出是否为1的阈值为θ^Tx=0。

技术分享图片

3.Decision Boundary

假设我们找到了一个合适的逻辑回归模型，那么，等价于确定了一组θ，使θ^Tx=0是合适的阈值。此时，θ^Tx=0将特征空间分割开了，就叫做Decision Boundary。

实际上，Decision Boundary就是对训练后的模型的另一种描述。

4.逻辑回归的Cost Function

为了评估模型拟合的程度，类比于线性回归，也需要Cost Function，线性回归的Cost Function不适用于逻辑回归。

需要寻找一种判断偏差的方法。

对于单个样本，考察一下对数函数：

技术分享图片

当实际是1时，是1的概率越大（h代表概率），偏差越小。同样，当实际是0时，是1的概率越大，偏差越大。

所有样本的偏差求和，Cost Function可以写作下式

技术分享图片

5.训练模型（找到偏差最小的参数）

最简单的还是梯度下降。公式再写一次：

技术分享图片

详细推导及求偏导数可见：详解。

此外，还可以用conjugate gradient、BFGS、L-BFGS等算法计算参数，效率更高，但比较复杂，不容易调试。

对于封装好的算法，只需要提供Cost Function和偏导数，可以自动选择α和计算了。

6.matlab实现一个逻辑回归。

技术分享图片

%data.csv [feature1 feature2 y]

sample = csvread(‘data.csv‘);
x(:,2) = sample(:,1);
x(:,3) = sample(:,2);
y(:,1) = sample(:,3);
x(:,1) = ones(size(x(:,2)));

m = length(x(:,2));

%choose logistic regression as model
%start with

theta = [1;2;1];
alpha = 1;
times = 5000;%迭代次数
J_theta = [1:times];

%cost function J_theta & gridient gri_J using gridient descent

for i=1:times
H = 1./(1+exp(-x*theta));
J_theta(i) = (-1/m) * (log(H‘)*y+log(1-H‘)*(1-y));
gri_J = (1/m).*((H-y)‘ * x)‘;
theta = theta - alpha.* gri_J;
end

plot(J_theta);
% deci_bond_y = -(1/theta(3)).*(theta(1)+theta(2).* x(:,2));
%
% stem(x(:,2),x(:,3),‘x‘);
% hold on;
% plot(x(:,2),deci_bond_y);

技术分享图片

7.多元分类

对于每个类别，看做这个类别和“”其他类别“”（课程里叫one versus all），这样就变回二元分类了。

再对每种类别分别做二元分类，得到N个分类器。

当需要测试时，将数据输入到每个分类器，选概率最大的一个作为输出。

小结

逻辑回归建立在线性回归的基础之上。模型为：通过sigmoid函数求输出是1的概率。应用在输出应符合伯努利分布的情况。

梯度下降算法还是好用的，也有了一些更高效的算法。刚开始的时候，可以先拿来用，再慢慢去深入学习。

线性回归和逻辑回归用于处理不同问题，但使用方法都是：分析数据、选取模型、优化数据、选择算法、训练、得到训练后的模型。

Andrew Ng机器学习（二）：逻辑回归

标签：大于 UNC alpha .net tail 就是 gradient 需要迭代

原文地址：https://www.cnblogs.com/sumr/p/9750145.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行