码迷,mamicode.com
首页 >  
搜索关键字:样本    ( 4292个结果
模式识别开发之项目---计算机视觉目标检测的框架与过程
个人接触机器视觉的时间不长,对于机器学习在目标检测的大体的框架和过程有了一个初步的了解,不知道对不对,如有错误,请各位大牛不吝指点。目标的检测大体框架:目标检测分为以下几个步骤:1、训练分类器所需训练样本的创建: 训练样本包括正样本和负样本;其中正例样本是指待检目标样本(例如人脸或汽车等),负样本指...
分类:其他好文   时间:2014-08-31 01:36:30    阅读次数:269
这一周的收获与总结_BP
这一周主要用CUDA实现了BP前馈神经网络,但是一路也遇到了很多问题。1. 批梯度下降时修改权值与偏置时候没有将累积的误差项/偏置项除以总样本数,导致每次修改值远远大于真实值,程序最后全1或全0. 我最后用matlab运行时候,结合李春光老师的神经计算课件找到了这个bug2.CUDA运行多块多线程并...
分类:其他好文   时间:2014-08-30 02:21:28    阅读次数:299
验证码识别
本文所使用的验证码识别的方法非常暴力,高手可忽略。对于在客户端实现的“伪验证码”或使用静态图片的验证码,本文不作讨论。对于验证码的识别,一直以为,只要足够的样本,就可以分析出验证码的特征,从而进行分门别类,再通过和样本做比较,就可以得出正确验证码。这里简单而暴力的验证一下这个一直想验证而没有行动.....
分类:其他好文   时间:2014-08-30 01:13:28    阅读次数:341
数据挖掘——认识数据
一、数据集有数据对象组成。一个数据对象(样本、实例、数据点、对象、数据元组)有代表一个实体。二、属性类型属性是一个数据字段,表示数据对象的一个特征。属性可以是:标称、二元、序数、数值观测是给定属性的观测值。1、标称属性:一些对象的名称。2、二元属性:布尔属性。3、序数属性:值之间存在有意义的程度评定...
分类:其他好文   时间:2014-08-29 00:07:16    阅读次数:361
稀疏编码概率解释(基于1996年Olshausen与Field的理论 )
一、Sparse Coding稀疏编码稀疏编码算法是一种无监督学习方法,它用来寻找一组“超完备”基向量来更高效地表示样本数据。稀疏编码算法的目的就是找到一组基向量 ,使得我们能将输入向量 表示为这些基向量的线性组合:也就是虽然形如主成分分析技术(PCA)能使我们方便地找到一组“完备”基向量,但是.....
分类:其他好文   时间:2014-08-27 14:21:27    阅读次数:850
大数据:70多个网站让你免费获取大数据存储库
你是否需要大量的数据来检验你的APP性能?最简单的方法是从网上免费数据存储库下载数据样本。但这种方法最大的缺点是数据很少有独特的内容并且不一定能达到预期的结果。以下是70多家可以获得免费大数据存储库的网站。 Wikipedia:Database :向感兴趣的用户提供所有可用的内容的免费副本。可以得....
分类:Web程序   时间:2014-08-26 02:52:45    阅读次数:351
白话压缩感知(含Matlab代码)
压缩感知介绍压缩感知(Compressive Sensing,CS),有时也叫成Compressive Sampling。相对于传统的奈奎斯特采样定理——要求采样频率必须是信号最高频率的两倍或两倍以上(这就要求信号是带限信号,通常在采样前使用低通滤波器使信号带限),压缩感知则利用数据的冗余特性,只采集少量的样本还原原始数据。这所谓的冗余特性,借助MLSS2014马毅老师的课件上的例子来说明,因为自...
分类:其他好文   时间:2014-08-25 17:10:25    阅读次数:334
机器学习【2】决策树中熵和信息增益的计算,构造决策树 ID3
信息熵很亮的是在你知道一个事件的结果后,平均会带给你多大的信息量,当事件的不确定性越大,那么要搞清它所需要的信息量也就越大,也就是信息熵越大,是无序性,不确定性的度量指标。 信息熵的计算: -p[i]logp[i],底数为2 public static double calcEntropy(int p[]) { double entropy = 0; // 用来计算总的样本数量,p[...
分类:其他好文   时间:2014-08-25 15:01:05    阅读次数:293
描述性统计-1
包括:计量资料的描述统计、正态分布计数资料的描述性统计统计图过程:分析数据的基本特征(分布、均数、标准差、标准误、样本容量)分析分类变量的频数分布标准化处理***********************************************demo1:10名健康男性工人的血红蛋白量(g/L...
分类:其他好文   时间:2014-08-24 12:56:42    阅读次数:219
【模式识别】Boosting
Boosting简单介绍分类中通常使用将多个弱分类器组合成强分类器进行分类的方法,统称为集成分类方法(Ensemble Method)。比較简单的如在Boosting之前出现Bagging的方法,首先从从总体样本集合中抽样採取不同的训练集训练弱分类器,然后使用多个弱分类器进行voting,终于的结果...
分类:其他好文   时间:2014-08-24 10:16:42    阅读次数:199
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!