码迷,mamicode.com
首页 > 编程语言 > 详细

机器学习实战笔记(Python实现)-07-分类性能度量指标

时间:2017-01-03 17:02:35      阅读:297      评论:0      收藏:0      [点我收藏+]

标签:问题   style   比较   类别   右上角   完全   log   http   阈值   

1、混淆矩阵

下图是一个二类问题的混淆矩阵,其中的输出采用了不同的类别标签

技术分享

常用的衡量分类性能的指标有:

  • 正确率(Precision),它等于 TP/(TP+FP) ,给出的是预测为正例的样本中的真正正例的比例。
  • 召回率(Recall),他等于 TP/(TP+FN),给出的是预测为正例的真实正例占所有真实正例的比例。

2、ROC曲线 

技术分享

 

图中的横轴是伪正例的比例(假阳率=FP/(FP+TN)),而纵轴是真正例的比例(真阳率=TP/(TP+FN))。ROC曲线给出的是当阈值变化时假阳率和真阳率的变化情况。左下角的点所对应的是将所有样例判为反例的情况,而右上角的点对应的则是将所有样例判为正例的情况。虚线给出的是随机猜测的结果曲线。

对不同的ROC曲线进行比较的一个指标是曲线下的面积(Area Unser the Curve)。AUC给出的是分类器的平均性能值,当然它并不能完全代替对整条曲线的观察。一个完美分类器的AUC为1.0,而随机猜测的AUC则为0.5。 

 

 

THE END.

 

机器学习实战笔记(Python实现)-07-分类性能度量指标

标签:问题   style   比较   类别   右上角   完全   log   http   阈值   

原文地址:http://www.cnblogs.com/hemiy/p/6237539.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!