Matlab中特征向量间距离矩阵的多线程mex程序...
分类:
其他好文 时间:
2014-10-09 01:19:07
阅读次数:
155
考虑用机器学习建立一个邮件过滤系统,来将邮件分成垃圾邮件和非垃圾邮件。首先我们建立一个词典,里面包含了邮件中所有的不重复单词。我们用长度为词典中单词数目的特征向量来表示一封邮件。如下所示:表示一封邮件,如果该邮件包含有词典中的第i个单词,那么,否则.为了建模,作一个很强的假设,假设词典中的每个单词是...
分类:
其他好文 时间:
2014-10-08 01:25:54
阅读次数:
385
稀疏编码在稀疏自编码算法中,我们试着学习得到一组权重参数 W(以及相应的截距 b),通过这些参数可以使我们得到稀疏特征向量 σ(Wx + b) ,这些特征向量对于重构输入样本非常有用。稀疏编码可以看作是稀疏自编码方法的一个变形,该方法试图直接学习数据的特征集。利用与此特征集相应的基向量,将学习得到的...
分类:
其他好文 时间:
2014-09-19 21:00:16
阅读次数:
400
常用相似性度量(距离 相似系数)在分类聚类算法,推荐系统中,常要用到两个输入变量(通常是特征向量的形式)距离的计算,即相似性度量.不同相似性度量对于算法的结果,有些时候,差异很大.因此,有必要根据输入数据的特征,选择一种合适的相似性度量方法.令X=(x1,x2,..,xn)T,Y=(y1,y2,.....
分类:
其他好文 时间:
2014-09-05 19:48:51
阅读次数:
595
特征向量的几何意义长时间以来一直不了解矩阵的特征值和特征向量到底有何意义(估计很多兄弟有同样感受)。知道它的数学公式,但却找不出它的几何含义,教科书里没有真正地把这一概念从各种角度实例化地进行讲解,只是一天到晚地列公式玩理论——有个屁用啊。根据特征向量数学公式定义,矩阵乘以一个向量的结果仍是同维数的...
分类:
其他好文 时间:
2014-08-31 00:20:00
阅读次数:
288
第二章 感知机感觉感知机这东西还是很简单的,随便写点。感知机(perceptron)是二分类的线性分类器。输入x表示实例的特征向量,输出y为实例的类别,由如下函数表示: 其中w为权值(weight)或权值向量(weight vector),b表示偏置(bias),sign为符号函数,里面的东西大于....
分类:
其他好文 时间:
2014-08-27 20:21:48
阅读次数:
241
一、Simhash简介 SimHash是用来网页去重最常用的hash方法,速度很快。Google采用这种算法来解决万亿级别的网页去重任务。 SimHash算法的主要思想是降维。将高维的特征向量映射成一个低维的特征向量,通过两个向量...
分类:
其他好文 时间:
2014-08-18 12:43:55
阅读次数:
249
特征值与特征向量的求法设A为n阶方阵,如果数“ ”和n维列向量x使得关系式 成立,则称 为方阵A的特征值,非零向量x称为A对应于特征值“ ”的特征向量。详见1.3.5和1.3.6节:特征值分解问题。例1-89 求矩阵 的特征值和特征向量解:>>A=[-2 1 1;0 2 0;-4 1 3];>>[V...
分类:
其他好文 时间:
2014-08-11 00:14:20
阅读次数:
315
[1. 特征的数学意义]我们先考察一种线性变化,例如x,y坐标系的椭圆方程可以写为x^2/a^2+y^2/b^2=1,那么坐标系关于原点做旋转以后,椭圆方程就要发生变换。我们可以把原坐标系的(x,y)乘以一个矩阵,得到一个新的(x',y')的表示形式,写为算子的形式就是(x,y)*M=(x',y')...
分类:
其他好文 时间:
2014-08-04 10:33:36
阅读次数:
227
机器学习问题方法总结大类名称关键词有监督分类决策树信息增益分类回归树Gini指数,Χ2统计量,剪枝朴素贝叶斯非参数估计,贝叶斯估计线性判别分析Fishre判别,特征向量求解K最邻近相似度度量:欧氏距离、街区距离、编辑距离、向量夹角、Pearson相关系数逻辑斯谛回归(二值分类)参数估计(极大似然估计...
分类:
其他好文 时间:
2014-08-03 23:05:56
阅读次数:
416