最近看了一些矩阵和谱聚类的知识,特在此简单记录一下。详细可以先看下参考文献。
首先看到的是孟岩写的三篇.
一:理解矩阵(一)
1:传统书籍空间的定义:存在一个集合,在这个集合上定义某某概念,然后满足某些性质”,就可以被称为空间。孟的空间包含四点:(1). 由很多(实际上是无穷多个)位置点组成;(2). 这些点之间存在相对的关系;(3). 可以在空间中定义长度、角度;4.
这个空间可以容纳运...
分类:
其他好文 时间:
2014-12-15 17:17:39
阅读次数:
176
#include #include #include #define MAX_CLUSTERS (8)using namespace std;int main( int argc, char **argv){IplImage *imgA = cvLoadImage( "1.jpg", CV_LOAD...
分类:
其他好文 时间:
2014-12-15 16:47:47
阅读次数:
379
主成份分析历史:
Pearson于1901年提出,再由Hotelling(1933)加以发展的一种多变量统计方法。通过析取主成分显出最大的个别差异,也用来削减回归分析和聚类分析中变量的数目,可以使用样本协方差矩阵或相关系数矩阵作为出发点进行分析。
通过对原始变量进行线性组合,得到优化的指标:把原先多个指标的计算降维为少量几个经过优化指标的计算(占去绝大部分份额)
基本思想:设法将原先众多具有...
分类:
编程语言 时间:
2014-12-15 10:29:54
阅读次数:
290
今天继续和小伙伴们分享聚类算法和R语言的实现,上篇和大家分享了聚类中的距离、类间距离和最古典的层次聚类法,今天和大家分享几个动态聚类算法。
首先和大家分享被评为十大数据挖掘算法之一的K-means 算法(K为分类的个数,mean为平均值,该算法的难点即为K的指点)
Step1:选择K个点作为初始质心;
Step2:将剩余每个点指派到最近的质心,形成K个簇(聚类);
Step3:重新计算簇的...
分类:
编程语言 时间:
2014-12-12 11:47:35
阅读次数:
277
问题1:空间数据挖掘有哪些常用方法,举例说明一种方法的原理及应用.
答:空间数据挖掘的常用方法有:统计法,聚类方法,关联规则发掘方法,Rough集方法,神经网络方法,云理论,证据理论,模糊集理论,遗传算法等算法(出自丁信宙,仇环,苏晓庆. 基于云理论的缺损数据推理和预测 山东理工大学学报 2006年11月)。除此以外还有老师课件上提到的聚类检测,决策树方法等。
以下对于一...
分类:
其他好文 时间:
2014-12-11 00:24:07
阅读次数:
265
前面和大家分享的分类算法属于有监督学习的分类算法,今天继续和小伙伴们分享无监督学习分类算法---聚类算法。聚类算法也因此更具有大数据挖掘的味道
聚类算法本质上是基于几何距离远近为标准的算法,最适合数据是球形的问题,首先罗列下常用的距离:
绝对值距离(又称棋盘距离或城市街区距离)
Euclide距离(欧几里德距离,通用距离)
Minkowski 距离(闵可夫斯基距离),欧...
分类:
编程语言 时间:
2014-12-10 18:12:05
阅读次数:
280
Mahout进阶课程,网盘下载:链接:http://pan.baidu.com/s/1dDGPM4x密码:pqdk网盘失效的话,请加QQ:3113533060课程大纲:第一周Mahout概述Mahout安装Mahout安装测试Mahout算法库介绍解析聚类算法解析分类算法协同过滤算法第二周聚类算法详解一、canopy算法简介1)mahout中canop..
分类:
其他好文 时间:
2014-12-09 15:49:26
阅读次数:
665
K-Means需要设定一个簇心个数的参数,现实中,最常用于确定K数的方法,其实还是人手工设定。例如,当我们决定将衣服做成几个码的时候,其实就是在以人的衣服的长和宽为为特征进行聚类。所以,弄清楚我们更在意的是什么,能够引导选择更合适的K值。 有种方法能自动决定K值,也就是所谓的Elbow Met...
分类:
其他好文 时间:
2014-12-07 17:36:36
阅读次数:
375
最近由于毕业设计的需要开始学习使用Python的Numpy和matplotlib来做聚类算法和可视化的一些研究。就从Numpy和matplotlib的安装开始吧。
分类:
其他好文 时间:
2014-12-07 14:55:36
阅读次数:
174
mahout入门指南之mahout单机版推荐算法
鄙人最近在研究mahout,网上找了一些入门资料来看,发现都整理的比较乱。折腾了一番,终于搞清楚了。为了让新手们较快入门,决定总结分享一下,写此入门指南。
mahout是什么?
mahout是一个机器学习库,里面实现了一些算法,比如推荐算法,聚类算法。
实现方式有单机内存版,也有分布式(hadoop和spark)。...
分类:
编程语言 时间:
2014-12-06 15:26:15
阅读次数:
368