码迷,mamicode.com
首页 >  
搜索关键字:训练集    ( 799个结果
线性回归
回归问题是根据一组特征(feature),预测一个值,和分类问题不同,这个值是连续的,分类问题的预测值是离散的。 m:训练集的记录条数 x:训练集中的一条记录的输入变量部分,或者说特征值 y:训练集中的记录的输出...
分类:其他好文   时间:2015-01-28 13:13:19    阅读次数:223
使用MLP解决OCR问题(OpenCV)(下)
分类模型:        分类模型涉及的一个比较关键的问题就是输出的10维向量是如何与具体的类别挂钩的。实际上:10维向量的每一位都代表一类,在对于训练集的表达中,如果输入数据是0,则10维向量的第一位赋值为1,其余均为0。即0对应[1,0,0,0,0,0,0,0,0,0]。MLP模型训练完成后,就需要对用户输入的数据所属类别进行判定。这时得到的输出数据基本不可能是正好的所属类为1,其他位置为0...
分类:其他好文   时间:2015-01-23 18:29:45    阅读次数:999
【读书笔记】《推荐系统(recommender systems An introduction)》第七章 评估推荐系统
基本思想:将数据分为训练集合和测试集合,用训练集合的数据训练模型,用测试集合的数据测试模型。训练集和测试集的划分,可以是按照时间的维度,也可以按照人群的维度。 存在风险:对于某些方法可能有偏向性。 用历史数据进行评价 按照时间维度将数据分为训练集合测试集,N折交叉验证。 还有直接用人工进行评价的。不过代价较大,不能上规模,在实际中用处不大。 完。...
分类:其他好文   时间:2015-01-17 18:02:07    阅读次数:165
K-最近邻算法
介绍 KNN算法全名为k-Nearest Neighbor,就是K最近邻的意思。KNN也是一种分类算法。但是与之前说的决策树分类算法相比,这个算法算是最简单的一个了。算法的主要过程为: 1、给定一个训练集数据,每个训练集数据都是已经分好类的。 2、设定一个初始的测试数据a,计算a到训练集所有数据的欧几里得距离,并排序。 3、选出训练集中离a距离最近的K个训练集数据。 4、比较k个训练集数...
分类:编程语言   时间:2015-01-12 09:32:18    阅读次数:599
k近邻法的C++实现:kd树
1.k近邻算法的思想给定一个训练集,对于新的输入实例,在训练集中找到与该实例最近的k个实例,这k个实例中的多数属于某个类,就把该输入实例分为这个类。因为要找到最近的k个实例,所以计算输入实例与训练集中实例之间的距离是关键!k近邻算法最简单的方法是线性扫描,这时要计算输入实例与每一个训练实例的距离,当...
分类:编程语言   时间:2015-01-05 07:00:14    阅读次数:502
[Example of Sklearn] - Example
reference :http://my.oschina.net/u/175377/blog/84420目录[-]Scikit Learn: 在python中机器学习载入示例数据一个改变数据集大小的示例:数码数据集(digits datasets)学习和预测分类K最近邻(KNN)分类器训练集和测试集...
分类:其他好文   时间:2015-01-03 17:05:35    阅读次数:694
机器学习基石第五讲笔记
通过前四讲可知,在假设集大小(M)有限的条件下,机器是可以学习的。第五讲的目的是解决M为无限大时,机器是否能学习的问题。为什么在假设集大小(M)有限的条件下,机器是可以学习的?1. 其依据是Hoeffding不等式:这个不等式说明了,训练集的错误率Ein(g)和测试集的错误率Eout(g)的差距太大...
分类:其他好文   时间:2014-12-23 00:03:42    阅读次数:208
K-近邻算法原理分析
前言 本文介绍机器学习分类算法中的K-近邻算法并给出伪代码,Python代码实现。算法原理 首先获取训练集中与目标对象距离最近的k个对象,然后再获取这k个对象的分类标签,求出其中出现频数最大的标签。 这个标签就是分类的结果。伪代码 对训练集中的每个点做以下操作: 1. 计算已知类别数据...
分类:编程语言   时间:2014-12-18 11:39:03    阅读次数:203
Coursera机器学习基石 第2讲:感知器
第一讲中我们学习了一个机器学习系统的完整框架,包含以下3部分:训练集、假设集、学习算法 一个机器学习系统的工作原理是:学习算法根据训练集,从假设集合H中选择一个最好的假设g,使得g与目标函数f尽可能低接近。H称为假设空间,是由一个学习模型的参数决定的假设构成的一个空间。而我们这周就要学习一个特定的....
分类:其他好文   时间:2014-12-08 00:38:06    阅读次数:466
机器学习之线性递归
一、先弄清楚机器学习的几个概念:训练集:训练样本,每个样本都由表示要学习的特征集(输入变量)和目标(输出变量) 设训练样本数为m 输入特征\变量input : x 其中每个样本用 表示(第i个样本),样本中每个特征/输入用表示(第i个样本中的第j个特征) 输出特征/变量output : y 其中.....
分类:其他好文   时间:2014-11-29 22:52:46    阅读次数:262
799条   上一页 1 ... 74 75 76 77 78 ... 80 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!