首页 > 编程语言 > 详细

斯坦福大学公开课机器学习：machine learning system design | trading off precision and recall（F score公式的提出：学习算法中如何平衡（取舍）查准率和召回率的数值）

时间：2018-01-21 21:29:16 阅读：271 评论：0 收藏：0 [点我收藏+]

标签：自己因此 machine info pos 公开课 div off 算法

一般来说，召回率和查准率的关系如下：1、如果需要很高的置信度的话，查准率会很高，相应的召回率很低；2、如果需要避免假阴性的话，召回率会很高，查准率会很低。下图右边显示的是召回率和查准率在一个学习算法中的关系。值得注意的是，没有一个学习算法是能同时保证高查准率和召回率的，要高查准率还是高召回率，取决于自己的需求。此外，查准率和召回率之间的关系曲线可以是多样性，不一定是图示的形状。

技术分享图片

如何取舍查准率和召回率数值：

一开始提出来的算法有取查准率和召回率的平均值，如下面的公式average=（P+R）/2。显然，在给出的三个算法当中，算法3的平均值是最高的，然而通过查准率（0.02）和召回率（1.0）可以看出这并不是一个很好的模型。因此，取平均值这个评估模式是不可取的。

技术分享图片

如果采用F score算法来同时评估查准率和召回率，则是比较有用的算法。分子的PR决定了查准率（P）和召回率（R）必须同时比较大，才能保证F score数值比较大。假如查准率或者召回率很低，接近于0，直接导致的后果PR值非常低，趋近于0，也就是F score也很低。

技术分享图片

此时再比较三个算法，可发现算法1是最优的，同时我们观察到算法3在这个公式中F score值是最低的。很好的说明了算法3不是一个很好的模型（查准率太低）。说明F score是一个很好的同时评估查准率和召回率的公式。

技术分享图片

斯坦福大学公开课机器学习：machine learning system design | trading off precision and recall（F score公式的提出：学习算法中如何平衡（取舍）查准率和召回率的数值）

标签：自己因此 machine info pos 公开课 div off 算法

原文地址：https://www.cnblogs.com/chenwenyan/p/8325476.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！