数据挖掘（入门知识）

时间：2015-01-10 16:36:45 阅读：157 评论：0 收藏：0 [点我收藏+]

标签：

最近在看一本叫《大话数据挖掘》的书，简单的摘要总结一些数据挖掘的基础理论知识：

1.Data Mining（在学术界也叫KDD:knowledge discovery in database），就是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的，我们事先不知道的、又潜在有用信息的知识的过程。（大多算法建立在：统计学的大数定律基础上）

2.Data Mining 能做什么：数据挖掘任务包括描述性任务和预测性任务两种：

描述性任务包括聚类、关联分析、序列、异常检测等，

预测性任务包括回归和分类。

（1）：关联规则挖掘 (1994 Apriori 算法)：也包括序列和时间序列

（2）：聚类分析（连续：K-means,K-Medoids,

（离散：K-模，k_原型）

（非球状簇：基于密度的聚类算法：DBSCAN、OPTICS、DENCLUE）

（层次聚类算法：凝聚&&分裂）

（视觉聚类算法）

（3）预测：基本原理是黑箱子模型（不管输入输出之间的具体关系是什么，只关系他们之间的联系，而不在乎他们之间的因果关系）

（4）回归：线性回归，线性拟合

（5）偏差的检测：对分析对象的少数的、极端的特例的描述，揭示内在的原因

后续补充。。。

标签：

原文地址：http://blog.csdn.net/hyqsong/article/details/42583953

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行