码迷,mamicode.com
首页 > 其他好文 > 详细

机器学习评价方法

时间:2017-12-12 13:38:23      阅读:114      评论:0      收藏:0      [点我收藏+]

标签:检测   post   好的   不同   直接   use   www   通过   body   

刚开始看这方面论文的时候对于各种评价方法特别困惑,还总是记混,不完全统计下,备忘。

关于召回率和精确率,假设二分类问题,正样本为x,负样本为o:

技术分享图片

准确率存在的问题是当正负样本数量不均衡的时候:

技术分享图片

精心设计的分类器最后算准确率还不如直接预测所有的都是正样本。

用Recall和Precision来衡量分类效果,可以使用F1 Score = 2PR/(P+R)来判断分类效果。

调整分类器,移动到这里:

技术分享图片

Recall达到百分之一百,但同时Precision也下降了:把不是负样本也分类成了正样本。一般来说,R高,P低,或者R低,P高。大概长这样:

技术分享图片技术分享图片

 

从这里偷来的图

一个好的分类方法当然是希望二者都尽量高,也就是右图红色线那样,所以提出又提出了一个衡量标准:mAP=∫P(R)dR,(PR曲线面积越大越好)。

 

当然不同应用有不同需求,还是要根据具体应用设计。

记得微软ECCV14的人脸检测就是先用OpenCV里的VJ方法,把Recall调得很高,尽量保证不漏检,同时带来的问题是Precision很低,有很多不是脸的东西,再通过3000帧人脸对齐方法,迭代几次,一边对齐人脸一边把不是脸的排除掉。

 

另外还有 ROC AUC 及其他各种......

评价指标的很多思想在cousera Machine Learning week6 lecture11里有

机器学习评价方法

标签:检测   post   好的   不同   直接   use   www   通过   body   

原文地址:http://www.cnblogs.com/zhengmeisong/p/8026750.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!