码迷,mamicode.com
首页 > 其他好文 > 详细

数据挖掘流程

时间:2018-09-27 00:12:50      阅读:202      评论:0      收藏:0      [点我收藏+]

标签:计数   变量   col   取数据   color   结果   取数   特征   读取   

数据挖掘流程:

(一)数据读取:

  • 读取数据,并进行展示
  • 统计数据各项指标
  • 明确数据规模与要完成任务

(二)特征理解分析

  • 单特征分析,逐个变量分析其对结果的影响
  • 多变量统计分析,综合考虑多种情况影响
  • 统计绘图得出结论

(三)数据清洗与预处理

  • 对缺失值进行填充
  • 特征标准化/归一化
  • 筛选有价值的特征
  • 分析特征之间的相关性

注意:数据挖掘80%的时间用于数据清洗。

(四)建立模型

  • 特征数据与标签准备
  • 数据集切分
  • 多种建模算法对比
  • 集成策略等方案改进

 

数据挖掘流程

标签:计数   变量   col   取数据   color   结果   取数   特征   读取   

原文地址:https://www.cnblogs.com/swordfall/p/9710580.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!