标签:
需要分析的文件:
右键分别创建读取excel数据,选择属性,设置对象,决策树算法这几个过程,然后连接起来
读取excel数据:【Insert Operator】—>【Import】—>【Data】—>【Read Excel】
选择属性:【Insert Operator】—>【Data Transformation】—>【Attribute Set Reduction and Transformation】—>【Selection】—>【Select Attributes】
设置对象:【Insert Operator】—>【Data Transformation】—>【Name and Role Modification】—>【Set Role】
决策树算法:【Insert Operator】—>【Modeling】—>【Classification and Regression】—>【Tree Induction】—>【Decision Tree】
点击【Read Excel】过程,右边出现
点击【Import Configuration Wizard】
全灰色表示全部选中,点击【Next】
第一栏的Name表示第一栏不是数据,如果不填就表示第一栏是跟下面的数据类型一样的,【Next】
体重变化只有两个值,选择【binominal】。点击【Finish】
点击【Select Attributes】过程中的【attribute filter type】选择【all】,对所有列进行分析
点击【Set Role】过程中的【attribute name】中的【体重变化】,【target role】中的【label】,以体重变化为主要研究对象
决策树算法按默认,
点击运行
生成决策树
1.Tree
2.指标1 > 5.883
3.| 指标2 > 9.843: 负 {负=2, 正=0}
4.| 指标2 ≤ 9.843
5.| | 指标3 > 9.868: 负 {负=2, 正=1}
6.| | 指标3 ≤ 9.868
7.| | | 指标2 > 8.645
8.| | | | 指标3 > 6.614: 负 {负=7, 正=0}
9.| | | | 指标3 ≤ 6.614
10.| | | | | 指标1 > 6.736: 正 {负=0, 正=11}
11.| | | | | 指标1 ≤ 6.736: 负 {负=1, 正=1}
12.| | | 指标2 ≤ 8.645: 正 {负=8, 正=182}
13.指标1 ≤ 5.883
14.| 指标3 > 0.027
15.| | 指标3 > 0.234
16.| | | 指标2 > 5.642: 负 {负=110, 正=0}
17.| | | 指标2 ≤ 5.642
18.| | | | 指标1 > 3.079
19.| | | | | 指标3 > 8.448: 负 {负=11, 正=0}
20.| | | | | 指标3 ≤ 8.448
21.| | | | | | 指标5 > 0.370
22.| | | | | | | 指标3 > 3.320
23.| | | | | | | | 指标4 > 0.559
24.| | | | | | | | | 指标1 > 3.369
25.| | | | | | | | | | 指标3 > 5.871
26.| | | | | | | | | | | 指标2 > 1.889
27.| | | | | | | | | | | | 指标1 > 5.517: 正 {负=0, 正=2}
28.| | | | | | | | | | | | 指标1 ≤ 5.517
29.| | | | | | | | | | | | | 指标5 > 8.864: 正 {负=0, 正=2}
30.| | | | | | | | | | | | | 指标5 ≤ 8.864: 负 {负=12, 正=0}
31.| | | | | | | | | | | 指标2 ≤ 1.889: 正 {负=0, 正=6}
32.| | | | | | | | | | 指标3 ≤ 5.871: 正 {负=0, 正=15}
33.| | | | | | | | | 指标1 ≤ 3.369: 负 {负=3, 正=0}
34.| | | | | | | | 指标4 ≤ 0.559: 负 {负=4, 正=0}
35.| | | | | | | 指标3 ≤ 3.320: 正 {负=0, 正=24}
36.| | | | | | 指标5 ≤ 0.370: 负 {负=2, 正=0}
37.| | | | 指标1 ≤ 3.079
38.| | | | | 指标2 > 0.268
39.| | | | | | 指标3 > 1.365: 负 {正=1, 负=64}
40.| | | | | | 指标3 ≤ 1.365
41.| | | | | | | 指标2 > 1.977
42.| | | | | | | | 指标1 > 1.829: 正 {负=1, 正=3}
43.| | | | | | | | 指标1 ≤ 1.829: 负 {负=7, 正=0}
44.| | | | | | | 指标2 ≤ 1.977: 正 {负=0, 正=2}
45.| | | | | 指标2 ≤ 0.268
46.| | | | | | 指标1 > 1.251: 正 {负=0, 正=3}
47.| | | | | | 指标1 ≤ 1.251: 负 {负=2, 正=0}
48.| | 指标3 ≤ 0.234
49.| | | 指标1 > 2.099: 正 {负=0, 正=7}
50.| | | 指标1 ≤ 2.099: 负 {负=2, 正=0}
51.| 指标3 ≤ 0.027: 正 {负=0, 正=2}
另外,对表数据读取过程右击,选择【Show ExampleSet Result】
可进行数据统计分析
RapidMiner的基本使用(一个医疗数据的简单决策树算法分析)
标签:
原文地址:http://www.cnblogs.com/XBlack/p/5064857.html