码迷,mamicode.com
首页 > 其他好文 > 详细

机器学习中分类问题

时间:2017-03-22 20:59:56      阅读:196      评论:0      收藏:0      [点我收藏+]

标签:过程   衡量   参数   ssi   linear   near   线性回归   cti   需要   

regression与线性回归(linear regression)

线性回归(linear regression):

  • 有监督学习 => 学习样本为D={(xi,yi)}a
  • 输出/预测的结果yi为连续值变量
  • 需要学习映射f:x~y
  • 假定输入x和输出y之间有线性相关关系    

 

损失函数(loss function)

我们要找到最好的权重/参数Θ

怎么去衡量“最好”? 定义损失函数 

 

最小化损失函数 梯度下降(Gradient descend)

逐步最小化损失函数的过程

如同下山,找准方向(斜率),每次迈进一小步,直至山底

 

找到合适的学习率(步长),再进行训练,否则特征多,样本的多的情况下成本会很大的。

数学和工程区别是工程找到大致可用的就可以了,数学是找打最优解。

特征的工作,耗时很多。

工业界最多的解决的是分类问题。

线性回归不适合做分类,不够坚定,受噪声影响大。

用得到的y值划定阈值来分类

 

逻辑回归:把负无穷到正无穷压缩到0~1之间(可以看作概率域分布)

常用sigmoid函数映射

把线性回归转变成分类问题,找出一条判定边界

 

线性的判定边界

 

 

机器学习中分类问题

标签:过程   衡量   参数   ssi   linear   near   线性回归   cti   需要   

原文地址:http://www.cnblogs.com/vincentqliu/p/regression.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!