利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。①
分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以...
分类:
其他好文 时间:
2014-05-15 07:40:07
阅读次数:
213
上一讲说到,各个特征(各个分量)对分类来说,其重要性当然是不同的。
舍去不重要的分量,这就是降维。
聚类变换认为:重要的分量就是能让变换后类内距离小的分量。
类内距离小,意味着抱团抱得紧。
但是,抱团抱得紧,真的就一定容易分类么?
如图1所示,根据聚类变换的原则,我们要留下方差小的分量,把方差大(波动大)的分量丢掉,所以两个椭圆都要向y轴投影,这样悲剧了,两个重叠在一起,根本...
分类:
其他好文 时间:
2014-05-11 20:17:34
阅读次数:
313
收入囊中
meanshift图像聚类meanshift object detect
葵花宝典
今天有点累,理论就讲少点吧T_T
meanshift中文是均值飘逸,就是给定一个点,然后会移动到概率密度最大的地方。
对于图像,什么是概率密度最大?
我们可以定义很多要素:
距离
RGB
HSV
下面我有个例子,就是用距离(x,y)和HSV(h,s,v)作图像聚类的。
...
分类:
其他好文 时间:
2014-05-11 02:16:10
阅读次数:
530
R语言聚类K-Means1、 随机生成3个簇点>
c1=cbind(rnorm(20,2,1),rnorm(20,2,1))>
c2=cbind(rnorm(20,3,2),rnorm(20,15,3))>
c3=cbind(rnorm(20,20,2),rnorm(20,20,3))> v=rbi...
分类:
其他好文 时间:
2014-05-10 02:58:50
阅读次数:
603
多传感器信息融合的意义:可有效的解决单传感器的模糊点更精确的观察和解释环境。多传感器信息融合的方法(算法):
经典推理法、加权平均法、卡尔曼滤波、贝叶斯估计、D-S证据理论、统计决策理论、聚类分析、参数模板、熵法、品质因数法、估计理论法、专家系统法、产生式规则、人工神经网络、模糊推理、粗糙集理论.....
分类:
移动开发 时间:
2014-05-10 01:19:12
阅读次数:
365
数据仓库技术包括数据清理、数据集成和联机分析处理(OLAP)OLAP是一种分析技术,具有汇总,合并和聚集功能,以及从不同的角度观察信息的能力。但,对于深层次的分析,如数据分类,聚类和数据随时间变化的特征,仍然需要其他
分析工具。尽管市场上已有许多“数据挖掘系统”,但是并非所有的 都能进行真正的数据挖...
分类:
其他好文 时间:
2014-05-08 20:18:07
阅读次数:
323
AP聚类算法是目前十分火的一种聚类算法,它解决了传统的聚类算法的很多问题。不仅简单,而且聚类效果还不错。这里,把前两天学习的AP算法在R语言上面的模拟,将个人笔记拿出来与大家分享一下,不谈AP算法的原理,只初步的讲一下应用,更多请关注下期。APClusting
in R相似矩阵的计算negDi...
分类:
其他好文 时间:
2014-05-05 10:36:46
阅读次数:
500