码迷,mamicode.com
首页 > 编程语言 > 详细

R语言 随机森林算法

时间:2018-02-26 17:36:19      阅读:281      评论:0      收藏:0      [点我收藏+]

标签:介绍   res   变量   查看   plot   package   pac   src   reading   

install.packages("randomForest")#安装R包

library(party)#输入数据

library(randomForest)#引入分析包

output.forest <- randomForest(nativeSpeaker ~ age + shoeSize + score,
data = readingSkills)#创建随机森林
print(output.forest)#查看
print(importance(output.forest,type = 2))#Gini指数 

gini指数表示节点的纯度,gini指数越大纯度越低。gini值平均降低量表示所有树的变量分割节点平均减小的不纯度。对于变量重要度衡量,步骤如同前面介绍,将变量数据打乱,gini指数变化的均值作为变量的重要程度度量。

结果如下:

技术分享图片

varImpPlot(output.forest)#可视化

技术分享图片

从上面显示的随机森林,我们可以得出结论,鞋码和成绩是决定如果某人是母语者或不是母语的重要因素。 此外,该模型只有1%~2%的误差,这意味着我们可以预测精度为98%。

 

R语言 随机森林算法

标签:介绍   res   变量   查看   plot   package   pac   src   reading   

原文地址:https://www.cnblogs.com/yangdongni/p/8473891.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!