标签:
---恢复内容开始---
在看了大话数据挖掘这本书前36页后,学到的知识。
数据挖掘(Data Mining)和数据库中的知识发现(KDD)互为别名。
数据挖掘的实例:啤酒与尿布、流量套餐用户群、套餐用户流失量原因、捆绑销售、零件维修费用的节制。
数据挖掘的概念:基于大量的、不完全的、有噪音的、模糊的、随机的数据中发现隐藏的有价值的知识。不完全的意思是在收集相应数据有缺失的,有噪音是获得的数据偏离了真实值,比如外界的干扰、测量仪器的故障、人工输入或抄写时的误差等。模糊性是指事物本身从属概念的不确定性,参照性,比如身高的高矮。随机性是指事件发生与否的不确定性,比如购买啤酒的即兴想法。
数据挖掘的功能:关联分析、聚类分析、分类分析、预测、回归分析、判别分析、时间序列分析、偏差甄别等。
数据挖掘的三大支柱:数据库、统计学、机器学习。
数据仓库:是一个面向主题的、集成的、随时间变化的、持久的数据集合,用于支持管理层的决策过程。
联机在线分析(OnLine Analytical Processing,OLAP):一种具有对数据进行汇集、合并和聚集以及从不同的角度观察信息的分析技术。
---恢复内容结束---
标签:
原文地址:http://www.cnblogs.com/rainy-season/p/5221720.html