码迷,mamicode.com
首页 > 其他好文 > 详细

机器学习基石:08 Noise and Error

时间:2017-10-07 20:41:27      阅读:164      评论:0      收藏:0      [点我收藏+]

标签:oat   ext   不一致   color   one   相等   noi   bsp   噪声   

噪声:误标、对同一数据点的标注不一致、数据点信息不准确......
噪声是针对整个输入空间的。
技术分享
存在噪声的情况下,VC bound依旧有用:
存在噪声,就是f--->p(y|x),f是p的特殊情况:如p(0|x)=1,p(1|x)=0。
VC bound本身就不管f的。
其实,推VC bound的时候第3步使用的是不放回的霍夫丁不等式,不要求独立同分布。
参照口袋算法,可以表明存在噪声情况下,VC bound依旧有用。
技术分享技术分享
错误/代价:分类常用0/1错误,回归常用均方误差。
技术分享
false positive/false accept:标签为-1,输出为+1。
false negative/false reject:标签为+1,输出为-1。
------false是指输出与实际标签不一致,positive为+,negative为-。
 
根据实际应用,对上面2种错误的惩罚一般是不一样的。
但是,对于真正的错误err,用户难以量化惩罚比例,可由我们选择合理的或者有益于算法的,记为err帽,作为err的近似。
技术分享技术分享
加权分类:
分类时进行错误衡量时,对false positive和false negative的惩罚不都是1。
如加权口袋算法,
0/1错误衡量保证了PA能够停止,那加权错误衡量如何保证加权PA能够停止呢?
可通过virtual examples copying转化为0/1错误衡量方式。
原始问题里D中每个样本点被访问的概率相等,virtual copy后D中标签值为-1的点被访问的概率变高,
但是PLA、PA都是要遍历一轮数据的,概率变化对算法影响不大。
技术分享技术分享
 

机器学习基石:08 Noise and Error

标签:oat   ext   不一致   color   one   相等   noi   bsp   噪声   

原文地址:http://www.cnblogs.com/cherrychenlee/p/7563230.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!