码迷,mamicode.com
首页 > 其他好文 > 详细

数据挖掘第一天

时间:2016-02-26 21:59:22      阅读:191      评论:0      收藏:0      [点我收藏+]

标签:

---恢复内容开始---

在看了大话数据挖掘这本书前36页后,学到的知识。

数据挖掘(Data Mining)和数据库中的知识发现(KDD)互为别名。

数据挖掘的实例:啤酒与尿布、流量套餐用户群、套餐用户流失量原因、捆绑销售、零件维修费用的节制。

数据挖掘的概念:基于大量的、不完全的、有噪音的、模糊的、随机的数据中发现隐藏的有价值的知识。不完全的意思是在收集相应数据有缺失的,有噪音是获得的数据偏离了真实值,比如外界的干扰、测量仪器的故障、人工输入或抄写时的误差等。模糊性是指事物本身从属概念的不确定性,参照性,比如身高的高矮。随机性是指事件发生与否的不确定性,比如购买啤酒的即兴想法。

数据挖掘的功能:关联分析、聚类分析、分类分析、预测、回归分析、判别分析、时间序列分析、偏差甄别等。

数据挖掘的三大支柱:数据库、统计学、机器学习。

数据仓库:是一个面向主题的、集成的、随时间变化的、持久的数据集合,用于支持管理层的决策过程。

联机在线分析(OnLine Analytical Processing,OLAP):一种具有对数据进行汇集、合并和聚集以及从不同的角度观察信息的分析技术。

 

 

---恢复内容结束---

数据挖掘第一天

标签:

原文地址:http://www.cnblogs.com/rainy-season/p/5221720.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!