使用excel进行数据挖掘(2)----分析关键影响因素
在配置环境后,可以使用excel进行数据挖掘。
环境配置问题可参阅:
http://blog.csdn.net/xinxing__8185/article/details/46445435
样例 DMAddins_SampleData.xlsx
文件下载地址:http://download.csdn.net/detail/xinxing__8185/8780481
在数据表中,选择table analysis tools sample表,该表中是用户的信息统计,包括婚姻状况,性别,收入,子女,教育程度,职业,是否有房子,汽车数量,居住区域,年龄,是否已购自行车等。
将鼠标点击表格中的数据,选项卡会多出一个
下面,将使用分析关键因素功能对数据进行一个分析举例:
根据已有用户的统计信息,对 收入 进行分析,及其他因素对于 收入 的影响。例如,一个有较好职业的用户,其相应的收入应该较高,反之亦然。职业可以是对于收入有较大影响的因素。
运行完成后,excel会生成如下报表。
在相对影响值列中,滑块长度越长,说明影响因素越大。例如,第一行数据,说明,某人的职业为从事体力劳动,其收入更倾向于低于39050
原文地址:http://blog.csdn.net/xinxing__8185/article/details/46470113