码迷,mamicode.com
首页 >  
搜索关键字:训练样本    ( 415个结果
半监督学习
概述 监督学习指的是训练样本包含标记信息的学习任务,例如:常见的分类与回归算法; 无监督学习则是训练样本不包含标记信息的学习任务,例如:聚类算法。 在实际生活中,常常会出现一部分样本有标记和较多样本无标记的情形,例如:做网页推荐时需要让用户标记出感兴趣的网页,但是少有用户愿意花时间来提供标记。若直接 ...
分类:其他好文   时间:2019-01-16 13:03:28    阅读次数:319
机器学习与人工智障(5):决策树与随机森林
一、从LR到决策树 1.总体流程与核心问题 (1)决策树是基于树的结构进行决策: 每个“内部节点”对应于某个属性上的“测试” 每个分支对应于该测试的一种可能结果(即该属性上的每个取值) 每个叶节点对应于一个预测结果 (2)学习过程:通过对训练样本的分析来确定“划分属性”(即内部节点所对应的属性) ( ...
分类:其他好文   时间:2019-01-12 13:14:55    阅读次数:202
2、单变量线性回归
引例:以房价和房屋面积作为训练集,学习如何预测房价 m 代表训练集的数量 x 代表输入变量(特征),这里代表房屋面积 y 代表输出变量(标签),这里代表房价 (x, y)表示一个训练样本 (x^(i), y^(i))表示第i个训练样本 单变量线性回归算法的实现过程 训练集(房屋面积x, 房价y)— ...
分类:其他好文   时间:2018-12-23 11:15:08    阅读次数:166
Dropout原理解析
1. Dropout简介 1.1 Dropout出现的原因 在机器学习的模型中,如果模型的参数太多,而训练样本又太少,训练出来的模型很容易产生过拟合的现象。在训练神经网络的时候经常会遇到过拟合的问题,过拟合具体表现在:模型在训练数据上损失函数较小,预测准确率较高;但是在测试数据上损失函数比较大,预测 ...
分类:其他好文   时间:2018-12-16 21:35:20    阅读次数:170
关于车牌识别的工作原理和技术参数
综合网上上各种车牌识别方法,总结出一个较为简单的车牌识别方案,采用VS2013+OpenCv2.4.9实现。并且附上可运行的源代码以及测试图片和视频,详细参数设置请参照源代码。识别部分的训练样本见我上传的资源。实现方法(一)检测车辆(基于混合高斯模型的背景差分法)读取视频(avi格式),选定目标区域框用于检测车辆检测车辆,基于混合高斯模型的背景差分法检测前景,经过腐蚀、膨胀后,若像素值大于200的
分类:其他好文   时间:2018-12-14 00:54:14    阅读次数:184
监督学习(Supervised learning)
定义符号 m:训练样本的数目 n:特征的数量 x‘s:输入变/特征值 y‘s:输出变量/目标变量 (x,y):训练样本 ->(x(i),y(i)):训练集,第i个训练样本,i=1,2..,m 监督学习 定义:(口头表达,非正式)我们给学习算法一个数据集,这个数据集由“正确答案”组成,它的目标是给定某 ...
分类:其他好文   时间:2018-12-12 16:23:15    阅读次数:130
拒绝推断问题(转)
拒绝推断(Reject Inference)是金融领域信用评分中的一个术语。对于要向银行借钱的人,我们需要考虑他们赖账的可能性。这样就需要根据他们的各种行为信息和人口统计学特征作为输入,来建立一个信用评分模型,这个建模过程与机器学习中训练一个模型类似。机器学习算法能够成功应用的一个条件是训练样本和测 ...
分类:其他好文   时间:2018-12-07 21:04:00    阅读次数:243
垃圾邮件分类
1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
分类:其他好文   时间:2018-12-06 22:25:26    阅读次数:257
朴素贝叶斯应用:垃圾邮件分类
1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
分类:其他好文   时间:2018-12-06 22:18:18    阅读次数:177
朴素贝叶斯应用:垃圾邮件分类
1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
分类:其他好文   时间:2018-12-06 21:23:36    阅读次数:247
415条   上一页 1 ... 6 7 8 9 10 ... 42 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!