"机器学习之类别不平衡问题 (1) —— 各种评估指标" "机器学习之类别不平衡问题 (2) —— ROC和PR曲线" 机器学习之类别不平衡问题 (3) —— 采样方法 前两篇主要谈类别不平衡问题的评估方法,重心放在各类评估指标以及ROC和PR曲线上,只有在明确了这些后,我们才能据此选择具体的处理类 ...
分类:
其他好文 时间:
2018-07-28 20:30:35
阅读次数:
230
机器学习的评估 PR曲线用于positive类数据占比比较小,或者你更加在意false postion(相比于false negative);其他情况采用ROC曲线;比如Demo中手写体5的判断,因为只有少量5,所以从ROC上面来看分类效果不错,但是从PR曲线可以看到分类器效果不佳。 y_score... ...
分类:
其他好文 时间:
2018-07-17 23:24:07
阅读次数:
502
机器学习:准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线 在介绍指标前必须先了解“混淆矩阵”: 混淆矩阵 True Positive(真正,TP):将正类预测为正类数,是正的,也预测正的 True Negative(真负,TN):将负类预测为负 ...
分类:
其他好文 时间:
2018-06-21 17:40:14
阅读次数:
182
在linear model中,我们对各个特征线性组合,得到linear score,然后确定一个threshold,linear score < threshold 判为负类,linear score > threshold 判为正类。画PR曲线时, 我们可以想象threshold 是不断变化的。首 ...
分类:
其他好文 时间:
2017-05-08 16:10:24
阅读次数:
824
在机器学习的算法评估中,尤其是分类算法评估中,我们经常听到精确率(precision)与召回率(recall),RoC曲线与PR曲线这些概念,那这些概念到底有什么用处呢? 首先,我们需要搞清楚几个拗口的概念: 1. TP, FP, TN, FN 听起来还是很费劲,不过我们用一张图就很容易理解了。图如 ...
分类:
其他好文 时间:
2017-04-05 22:12:47
阅读次数:
261
人脸检测(detection)在opencv中早就有直接能拿来用的haar分类器,基于Viola-Jones算法。但是毕竟是老掉牙的技术,Precision/Recall曲线渣到不行,在实际工程中根本没法给boss看,作为MSRA脑残粉,这里介绍一种MSRA在14年的最新技术:下点击打开链接载
。这篇文章直接在30ms的时间里把detection和alignment都给做了,PR曲线彪到很高,时...
分类:
其他好文 时间:
2016-05-18 19:58:08
阅读次数:
1969
Keywords: PR curve, ROC curve, Machine Learning, image processing
为了帮助大家理解,比如我们需要检测一个图像中的人,分类器将图像上的每个像素划分为人和非人像素,目标是人,所以检测为人的像素用Positives表示,检测为非人的像素用Negatives来表示,检测到了需要报告,检测到不是需要拒绝,检测到了实际不是则为误报(错误地报告)或...
分类:
其他好文 时间:
2015-08-01 19:06:21
阅读次数:
387
做过图像识别、机器学习或者信息检索相关研究的人都知道,论文的实验部分都要和别人的算法比一比。可怎么比,人多嘴杂,我说我的方法好,你说你的方法好,各做各的总是不行——没规矩不成方圆。于是慢慢的大家就形成了一种约定,用ROC曲线和PR曲线来衡量算法的优劣。关于ROC曲线和PR曲线的详细介绍可参考资料:ROC Analysis and the ROC Convex HullTom Fawcett,An ...
分类:
编程语言 时间:
2015-01-27 00:42:47
阅读次数:
271
TPR=TP/P :真正率:判断对的正样本占所有正样本的比例。 Precision=TP/(TP+FP) :判断对的正样本占判断出来的所有正样本的比例FPR=FP/N :负正率:判断错的负样本占所有负样本的比例。 Recall = TP/(TP+FN) = TP/P,就是TPR.ROC曲线:横轴是F...
分类:
其他好文 时间:
2014-10-26 22:29:59
阅读次数:
278
ROC曲线在网上有很多地方都有说ROC曲线对于正负样本比例不敏感,即正负样本比例的变化不会改变ROC曲线。但是对于PR曲线就不一样了。PR曲线会随着正负样本比例的变化而变化。但是没有一个有十分具体和严谨地对此做出过分析和论证(至少我没有找到)。此处记为结论1:结论1:PR曲线会随着正负样本比例的变化...
分类:
其他好文 时间:
2014-07-14 08:24:07
阅读次数:
493