码迷,mamicode.com
首页 > 其他好文 > 详细

<知识库的构建> 2-2 检测 Evaluation

时间:2018-01-29 19:16:26      阅读:144      评论:0      收藏:0      [点我收藏+]

标签:call   实例   and   log   body   不可   blog   知识   pos   

引自Fabian Suchanek的讲义。

 

总结:有三个指数可以看出算法是否好,精确度precision,召回率recall和F1指数。所以本章重点为记忆这三种计算方式。

 

黄金标准Golden Standard:任务执行在语料库后我们所期待的结果

对的:output与golden standard的交集

 

精确度 Precision:对的/output的长度

召回率 Recall:对的/golden standard的长度

Precision和Recall的关系:二者不可能都高,一定是一高一低。

-      若Precision高:说明结果很好,但是有很多instance没有被检测

-      若Recall高:得到的结果中有很多是错的,但泛化能力强

-      若黄金标准和output长度一样(一个实例一个结果时):precision=recall

F1指数F1 Mesure:表示precision和recall的均值

2 * (Precision * Recall) / (Precision + Recall)

<知识库的构建> 2-2 检测 Evaluation

标签:call   实例   and   log   body   不可   blog   知识   pos   

原文地址:https://www.cnblogs.com/mengzizhao/p/8378711.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!