1. 定义 距离判别问题的数学描述: 设有n个样本,对每个样本测得p项指标(变量)的数据,已知每个样本属于k个类别(或总体)G1,G2, …,Gk中的某一类,且它们的分布函数分别为F1(x),F2(x), …,Fk(x)。我们希望利用这些数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于...
分类:
其他好文 时间:
2015-04-15 21:16:42
阅读次数:
210
从概率论角度,判别分析是根据所给样本数据,对所给的未分类数据进行分类。如下表,已知有t个样本数据,每个数据关于n个量化特征有一个值,又已知该样本数据的分类,据此,求s个未分类数据的分类情况class。Matlab 的统计工具箱提供了判别函数[class,err] = classify(sample,...
分类:
其他好文 时间:
2015-02-03 10:55:03
阅读次数:
437
在R语言中,线性判别分析(Liner Discriminant Analysis,简称LDA),依靠软件包MASS中有线性判别函数lqa()来实现。该函数有三种调用格式:
1)当对象为数据框data.frame时
lda(x,grouping,prior = propotions,tol = 1.0e-4,method,CV = FALSE,nu,...)
2) 当对象为公式Formula时
lda(formula,data,...,subnet,na.action)
3) 当对象为矩阵Matr...
分类:
编程语言 时间:
2015-01-11 14:53:23
阅读次数:
945
上期与大家分享的传统分类算法都是建立在判别函数的基础上,通过判别函数值来确定目标样本所属的分类,这类算法有个最基本的假设:线性假设。今天继续和大家分享下比较现代的分类算法:决策树和神经网络。这两个算法都来源于人工智能和机器学习学科。
首先和小伙伴介绍下数据挖掘领域比较经典的Knn(nearest neighbor)算法(最近邻算法)
算法基本思想:
Step1:计算出待测样本与学习集中所有点...
分类:
编程语言 时间:
2014-12-09 10:40:01
阅读次数:
322
分类算法与我们的生活息息相关,也是目前数据挖掘中应用最为广泛的算法,如:已知系列的温度、湿度的序列和历史的是否下雨的统计,我们需要利用历史的数据作为学习集来判断明天是否下雨;又如银行信用卡诈骗判别。
分类问题都有一个学习集,根据学习集构造判别函数,最后根据判别函数计算我们所需要判别的个体属于哪一类的。
常见的分类模型与算法
传统方法
1、线性判别法;2、距离判别法;3、贝叶斯分类器;
现...
分类:
编程语言 时间:
2014-12-08 10:44:59
阅读次数:
409
这是我在上模式识别课程时的内容,也有参考这里。线性判别函数的基本概念判别函数为线性的情况的一般表达式 式中x是d 维特征向量,又称样本向量, 称为权向量, 分别表示为 是个常数,称为阈值权。设样本d维特征空间中描述,则两类别问题中线性判别函数的一般形式可表示成 (3-1) 其中 而ω0...
分类:
其他好文 时间:
2014-11-16 17:08:44
阅读次数:
281
1、概率密度函数
在分类器设计过程中(尤其是贝叶斯分类器),需要在类的先验概率和类条件概率密度均已知的情况下,按照一定的决策规则确定判别函数和决策面。但是,在实际应用中,类条件概率密度通常是未知的。那么,当先验概率和类条件概率密度都未知或者其中之一未知的情况下,该如何来进行类别判断呢?其实,只要我们能收集到一定数量的样本,根据统计学的知识,可以从样本集来推断总体概率分布。这种估计方法,通常称之为...
分类:
其他好文 时间:
2014-09-10 14:13:20
阅读次数:
294
用判别函数分类的概念首先模式识别系统的主要作用是:判别各个模式所属的类别,例如对一个两类问题的判别,就是将模式x划分为成ω1和ω2两类。两类问题的判别函数(以二维模式样本为例)若x是二维模式样本x
= (x1 x2)T,用x1和x2作为坐标分量,得到模式的平面图:这时,若这些分属于ω1和ω2两类的模...
分类:
其他好文 时间:
2014-06-12 08:55:19
阅读次数:
210
实验名称:贝叶斯分类器一、实验目的和要求 目的:掌握利用贝叶斯公式进行设计分类器的方法。
要求:分别做出协方差相同和不同两种情况下的判别分类边界。 二、实验环境、内容和方法环境:windows 7,matlab R2010a
内容:根据贝叶斯公式,给出在类条件概率密度为正态分布时具体的判别函数表达式...
分类:
其他好文 时间:
2014-05-10 02:50:11
阅读次数:
518