标签:strong nta 0.12 tags targe line vertica 表示 ace
分类方法常用的评估模型好坏的方法.
假设我现在有一个二分类任务,是分析100封邮件是否是垃圾邮件,其中不是垃圾邮件有65封,是垃圾邮件有35封.模型最终给邮件的结论只有两个:是垃圾邮件与 不是垃圾邮件.
经过自己的努力,自己设计了模型,得到了结果,分类结果如下:
现在我们设置,不是垃圾邮件.为正样本,是垃圾邮件为负样本
我们一般使用四个符号表示预测的所有情况:
先看最终的计算公式:
关注预测为正样本的数据(可能包含负样本)中,真实正样本的比例
计算公式
例子解释:对上前面例子,关注的部分就是预测结果
的70封不是垃圾邮件中真实不是垃圾邮件占该预测结果的比率,现在Precision=60/(600+10)=85.71%
关注真实正样本的数据(不包含任何负样本)中,正确预测的比例
计算公式
例子解释:对上前面例子,关注的部分就是真实有65封不是垃圾邮件,这其中你的预测结果中有多少预测正确了,Recall=60/(60+5)=92.31%
β是用来平衡Precision,Recall在F-score计算中的权重,取值情况有以下三种:
一般情况下,β取1.此时F-score的计算公式为:
3.其他考虑
预测模型无非就是两个结果
那我就可以直接按照下面的公式求预测准确率,用这个值来评估模型准确率不就行了
所以说,对于这种情况的二分类问题,一般使用Fscore去评估模型.
需要注意的是:Fscore只用来评估二分类的模型,Accuracy没有这限制
参考
1.机器学习中的 precision、recall、accuracy、F1 Score
2.分类模型的评估方法-F分数(F-Score)
标签:strong nta 0.12 tags targe line vertica 表示 ace
原文地址:https://www.cnblogs.com/wushaogui/p/9146049.html