搜索关键字：训练样本，搜索到415个结果！码迷,mamicode.com！

半监督学习

概述监督学习指的是训练样本包含标记信息的学习任务，例如：常见的分类与回归算法；无监督学习则是训练样本不包含标记信息的学习任务，例如：聚类算法。在实际生活中，常常会出现一部分样本有标记和较多样本无标记的情形，例如：做网页推荐时需要让用户标记出感兴趣的网页，但是少有用户愿意花时间来提供标记。若直接 ...

分类：其他好文时间：2019-01-16 13:03:28 阅读次数：319

机器学习与人工智障(5):决策树与随机森林

一、从LR到决策树 1.总体流程与核心问题 (1)决策树是基于树的结构进行决策：每个“内部节点”对应于某个属性上的“测试” 每个分支对应于该测试的一种可能结果(即该属性上的每个取值) 每个叶节点对应于一个预测结果 (2)学习过程：通过对训练样本的分析来确定“划分属性”(即内部节点所对应的属性) ( ...

分类：其他好文时间：2019-01-12 13:14:55 阅读次数：202

2、单变量线性回归

引例：以房价和房屋面积作为训练集，学习如何预测房价 m 代表训练集的数量 x 代表输入变量(特征)，这里代表房屋面积 y 代表输出变量(标签)，这里代表房价 (x, y)表示一个训练样本 (x^(i), y^(i))表示第i个训练样本单变量线性回归算法的实现过程训练集(房屋面积x, 房价y)— ...

分类：其他好文时间：2018-12-23 11:15:08 阅读次数：166

Dropout原理解析

1. Dropout简介 1.1 Dropout出现的原因在机器学习的模型中，如果模型的参数太多，而训练样本又太少，训练出来的模型很容易产生过拟合的现象。在训练神经网络的时候经常会遇到过拟合的问题，过拟合具体表现在：模型在训练数据上损失函数较小，预测准确率较高；但是在测试数据上损失函数比较大，预测 ...

分类：其他好文时间：2018-12-16 21:35:20 阅读次数：170

关于车牌识别的工作原理和技术参数

综合网上上各种车牌识别方法，总结出一个较为简单的车牌识别方案，采用VS2013+OpenCv2.4.9实现。并且附上可运行的源代码以及测试图片和视频，详细参数设置请参照源代码。识别部分的训练样本见我上传的资源。实现方法(一)检测车辆（基于混合高斯模型的背景差分法）读取视频（avi格式），选定目标区域框用于检测车辆检测车辆，基于混合高斯模型的背景差分法检测前景，经过腐蚀、膨胀后，若像素值大于200的

分类：其他好文时间：2018-12-14 00:54:14 阅读次数：184

监督学习(Supervised learning)

定义符号 m:训练样本的数目 n：特征的数量 x‘s：输入变/特征值 y‘s：输出变量/目标变量 (x,y)：训练样本 ->(x(i),y(i)):训练集，第i个训练样本，i=1,2..,m 监督学习定义：(口头表达，非正式)我们给学习算法一个数据集，这个数据集由“正确答案”组成，它的目标是给定某 ...

分类：其他好文时间：2018-12-12 16:23:15 阅读次数：130

拒绝推断问题（转）

拒绝推断（Reject Inference）是金融领域信用评分中的一个术语。对于要向银行借钱的人，我们需要考虑他们赖账的可能性。这样就需要根据他们的各种行为信息和人口统计学特征作为输入，来建立一个信用评分模型，这个建模过程与机器学习中训练一个模型类似。机器学习算法能够成功应用的一个条件是训练样本和测 ...

分类：其他好文时间：2018-12-07 21:04:00 阅读次数：243

垃圾邮件分类

1. 数据准备：收集数据与读取 2. 数据预处理：处理数据 3. 训练集与测试集：将先验数据按一定比例进行拆分。 4. 提取数据特征，将文本解析为词向量。 5. 训练模型：建立模型，用训练数据训练模型。即根据训练样本集，计算词项出现的概率P(xi|y)，后得到各类下词汇出现概率的向量。 6. 测 ...

分类：其他好文时间：2018-12-06 22:25:26 阅读次数：257

朴素贝叶斯应用：垃圾邮件分类

1. 数据准备：收集数据与读取 2. 数据预处理：处理数据 3. 训练集与测试集：将先验数据按一定比例进行拆分。 4. 提取数据特征，将文本解析为词向量。 5. 训练模型：建立模型，用训练数据训练模型。即根据训练样本集，计算词项出现的概率P(xi|y)，后得到各类下词汇出现概率的向量。 6. 测 ...

分类：其他好文时间：2018-12-06 22:18:18 阅读次数：177

朴素贝叶斯应用：垃圾邮件分类

1. 数据准备：收集数据与读取 2. 数据预处理：处理数据 3. 训练集与测试集：将先验数据按一定比例进行拆分。 4. 提取数据特征，将文本解析为词向量。 5. 训练模型：建立模型，用训练数据训练模型。即根据训练样本集，计算词项出现的概率P(xi|y)，后得到各类下词汇出现概率的向量。 6. 测 ...

分类：其他好文时间：2018-12-06 21:23:36 阅读次数：247