标签:应该 1.0 xpl 那是 问题 row absolute 计算机程序 targe
机器学习的入门,我们需要的一些基本概念:
M.Mitchell《机器学习》中的定义是:
对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序从经验E中学习。
两张图片很好的总结了(机器学习)的算法分类:
对于分类问题的结果可以用下表表示(说明:True或者False代表预测结果是否正确,Positive和Negative代表被程序找出的结果):
准确率的定义是对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。公式为:
准确率存在准确率悖论的缺陷,参考这里的具体说明。
精确率计算的是: 预测结果中符合实际值的比例,可以理解为没有“误报”的情形,公式为:
召回率计算的是:正确分类的数量与所有“应该”被正确分类(符合目标标签)的数量的比例,可以理解为精确率对应的没有“漏报”的情形。公式为:
F1 值是精确率和召回率的调和均值,定义为:
即,
准确率和召回率是互相影响的,理想情况下肯定是做到两者都高,但是一般情况下准确率高、召回率就低,召回率低、准确率高,当然如果两者都低,那是什么地方出问题了。当精确率和召回率都高时,F1的值也会高。在两者都要求高的情况下,可以用F1来衡量。
公式:
公式:
即“Coefficient of determination"决定系数,判断的是预测模型和真实数据的拟合程度,最佳值为1,可为负值。
y
【2】:机器学习概念参考:http://underthehood.blog.51cto.com/2531780/577854
【3】:机器学习总结: 链接
标签:应该 1.0 xpl 那是 问题 row absolute 计算机程序 targe
原文地址:http://www.cnblogs.com/1xin/p/6684029.html