# 使用好任何机器学习算法的前提是选好Features
from numpy import *
import operator
from os import listdir
def classify0(inX, dataSet, labels, k):
dataSetSize = dataSet.shape[0]
diffMat = tile(inX, (dat...
分类:
编程语言 时间:
2015-05-10 09:56:10
阅读次数:
202
本文出处:http://blog.csdn.net/xizhibei=============================PCA,也就是PrincipalComponents Analysis,主成份分析,是个非常优秀的算法,依照书上的说法:寻找最小均方意义下,最能代表原始数据的投影方法然后自己...
分类:
编程语言 时间:
2015-05-09 13:20:39
阅读次数:
127
其中的数据格式:
一行一个用户购买记录,uid pid1 pid2…#include
#include
#include
#include
#include
#include
#include
#define MaxString 50
#define M...
分类:
编程语言 时间:
2015-05-07 16:46:16
阅读次数:
209
k近邻(k-NearestNeighbor)算法简称kNN。基本思想简单直接,对于一个需要分类的数据实例x,计算x与所有已知类别的样本点在特征空间中的距离。取与x距离最近的k个样本点,统计这些样本点所属占比最大的类别,作为x的分类结果。下图中与绿色点最近的3个点中,2个属于红色类别,则认为x属于红色...
分类:
其他好文 时间:
2015-05-07 15:48:07
阅读次数:
140
第十四章:主成分和因子分析本章内容主成分分析探索性因子分析其他潜变量模型主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。它通过寻找一组更小的、潜在的或隐藏的结构来解释已观测...
分类:
其他好文 时间:
2015-05-06 22:45:31
阅读次数:
361
在模式识别领域中,PCA是一种常用的数据集降维手段,在此基础上,保留数据集中对方差贡献最大的特征从而进行模式分类。OpenCV中提供PCA的类,因此可以方便地使用PCA来进行人脸识别研究。在学习了网上的相关实现和代码,在以下开发平台跑通了代码:win8.1+OpenCV2.4.9+Qt5.3.2。...
分类:
其他好文 时间:
2015-05-01 16:12:13
阅读次数:
180
前言:如果学习分类算法,最好从线性的入手,线性分类器最简单的就是LDA,它可以看做是简化版的SVM,如果想理解SVM这种分类器,那理解LDA就是很有必要的了。 谈到LDA,就不得不谈谈PCA,PCA是一个和LDA非常相关的算法,从推导、求解、到算法最终的结果,都有着相当的相似。 本次的内容主要是以推...
分类:
其他好文 时间:
2015-04-29 16:52:02
阅读次数:
286
模板匹配
什么才是描述像不像的最直白简单的算法——KNN
什么才是学习出最贴近人的认知的模板匹配算法——KMEAN?KMEDOID?or other clustering methods?
什么样的结构最贴近人的认知
生成模型进化 -> 生成+判别模型
判别模型应该只是一种认知的一种,不是认知的全部,认知的全部应该是有概念的,但是判别模型却没法体现这一点
但是并不是说有...
分类:
其他好文 时间:
2015-04-27 18:29:49
阅读次数:
171
主成分分析PCA算法原理解析浅谈对主成分分析(PCA)算法的理解主成分分析(PCA):降维。将多个变量通过线性变换(线性相加)以选出较少个数重要变量。力求信息损失最少的原则。主成分:就是线性系数,即投影方向。通常情况下,变量之间是有一定的相关关系的,即信息有一定的重叠。将重复的变量删除。基本思想:将...
分类:
其他好文 时间:
2015-04-26 22:32:09
阅读次数:
457