1. 导入/生成样本数据集 2. 转换和归一化数据 3. 划分样本数据集为训练样本集、测试样本集和验证样本集 4. 设置机器学习参数(超参数) 5. 初始化变量和占位符 6. 定义模型结构 7. 声明损失函数 8. 初始化模型和训练模型 9. 评估机器学习模型 10. 调优超参数 11. 发布/预测 ...
分类:
其他好文 时间:
2019-04-20 15:40:37
阅读次数:
135
线性判别分析,简称LDA,是一种线性学习方法。 常用来降维,是一种有监督的降维方法,是基于最佳分类效果的降维方法。 核心思想 给定训练样本,带label,设法将样本投影到一条直线上,使得同类样例的投影尽可能接近,异类样例的投影尽可能远离; 在对新样本进行预测时,先将其投影到这条直线上,再根据投影点的 ...
分类:
其他好文 时间:
2019-04-20 11:27:10
阅读次数:
264
做deep-sort多目标跟踪需要结合yolo_v3进行检测行人 由于我的项目中需要对人脸进行检测,所以需要训练针对人脸的模型 训练样本是来自WIDER-FACE人脸库。(有3w+的图片和标注框) deep-sort结合yolo-v3的博客分享 https://blog.csdn.net/weixi ...
分类:
其他好文 时间:
2019-03-28 15:18:48
阅读次数:
1054
开始学习机器学习的基础知识了,下面是我在看书过程中,整理的一些重点。看的书是《机器学习实战》。 系统用来学习的这些示例,我们称之为训练集。每一个训练示例称为训练实例或者是训练样本。 机器学习与数据挖掘的关系: 应用机器学习技术来挖掘海量数据。 机器学习系统的种类: 是否在人类监督下训练(监督式学习、 ...
分类:
其他好文 时间:
2019-03-04 17:27:51
阅读次数:
148
Tensorflow+CNN下的mnist数据集手写数字识别 MNIST数据集包含55000个训练样本,10000个测试样本,还有5000个交叉验证数据样本。 输入:加载的每个手写数字图像是28 x 28像素大小的灰度图像。为了简化起见,将28x28的像素点展开为一维数据(shape=784)。 输 ...
分类:
其他好文 时间:
2019-03-02 18:50:23
阅读次数:
248
GBDT和XgBoost的区别 首先,GBDT来自于融合模型中的Boosting算法,Boosting算法的原理是先从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本分布进行调整,提高训练数据集中判断错误的样本权重,降低判断正确的权重,使得先前基学习器做错的样本在后续能得到更多关注,然后... ...
分类:
其他好文 时间:
2019-02-22 23:22:02
阅读次数:
213
scikit-learn提供了一系列转换库,他们可以清洗,降维,提取特征等。 在数据转换中有三个很重要的方法,fit,fit_transform,transform 1 2 3 初学时候好奇为何,训练样本用fit_transform,而测试样本用transform? 仔细阅读官方文档发现,fit方法 ...
分类:
其他好文 时间:
2019-02-20 15:54:55
阅读次数:
166
2.1 k-近邻算法概述 k-近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高、对异常值不敏感、无数据输入假定。 确定:计算复杂度高、空间复杂度高。 适用数据范围:数值型和标称型。 工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每 ...
分类:
编程语言 时间:
2019-02-15 18:04:05
阅读次数:
180
模型表示 多变量的线性回归也叫做“多元线性回归”。首先还是先明确几个符号的含义。 $x{^{(i)}_j}$ :第$i$个训练样本的第$j$个特征,比如 面积 , 楼层 , 客厅数 $x^{(i)}$ :第$i$个训练样本的输入 $m$ :训练样本的数量 $n$ :特征的数量 <! more 多元线 ...
分类:
其他好文 时间:
2019-01-28 00:44:43
阅读次数:
197
1.假设回归的目标函数式为 (其中x0为1) 当 n = 1时表示一元函数,对一元函数进行回归分析 2.将误差记为:ε 要使得ε最小,然后样本真实值 y 和模型训练预测的值之间是有误差 ε ,再假设训练样本的数据量很大的时候,根据中心极限定律可以得到 ∑ε 满足 (u ,δ²)高斯分布的;由于方程有 ...
分类:
其他好文 时间:
2019-01-16 13:55:44
阅读次数:
238