码迷,mamicode.com
首页 > 其他好文 > 详细

Random Forest面试要点总结

时间:2019-02-25 23:32:33      阅读:1069      评论:0      收藏:0      [点我收藏+]

标签:led   噪声   oob   .com   content   and   box   bsp   port   

随机森林的特征重要性原理

1、随机森林得到的feature importance的原理?

在随机森林中某个特征X的重要性的计算方法如下:

1:对于随机森林中的每一颗决策树,使用相应的OOB(袋外数据)数据来计算它的袋外数据误差,记为errOOB1.

2:  随机地对袋外数据OOB所有样本的特征X加入噪声干扰(就可以随机的改变样本在特征X处的值),再次计算它的袋外数据误差,记为errOOB2.

3:假设随机森林中有Ntree棵树,那么对于特征X的重要性=∑(errOOB2-errOOB1)/Ntree,之所以可以用这个表达式来作为相应特征的重要性的度量值是因为:若给某个特征随机加入噪声之后,袋外的准确率大幅度降低,则说明这个特征对于样本的分类结果影响很大,也就是说它的重要程度比较高。

 

Random Forest面试要点总结

标签:led   噪声   oob   .com   content   and   box   bsp   port   

原文地址:https://www.cnblogs.com/nxf-rabbit75/p/10434420.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!