代码多来自《Introduction to Machine Learning with Python》. 该文集主要是自己的一个阅读笔记以及一些小思考,小总结。 前言 在开始进行模型训练之前,非常有必要了解准备的数据:数据的特征,数据和目标结果之间的关系是什么? 而且这可能是机器学习过程中最重要的部 ...
分类:
其他好文 时间:
2018-03-30 23:09:21
阅读次数:
4539
一、前述 调优对于模型训练速度,准确率方面至关重要,所以本文对神经网络中的调优做一个总结。 二、神经网络超参数调优 1、适当调整隐藏层数对于许多问题,你可以开始只用一个隐藏层,就可以获得不错的结果,比如对于复杂的问题我们可以在隐藏层上使用足够多的神经元就行了, 很长一段时间人们满足了就没有去探索深度 ...
分类:
其他好文 时间:
2018-03-28 14:14:36
阅读次数:
195
参见原书1.5节 构建预测模型的一般流程 问题的日常语言表述->问题的数学语言重述重述问题、提取特征、训练算法、评估算法 熟悉不同算法的输入数据结构:1.提取或组合预测所需的特征2.设定训练目标3.训练模型4.评估模型在训练数据上的性能表现 机器学习:开发一个可以实际部署的模型的全部过程,包括对机器 ...
分类:
编程语言 时间:
2018-03-04 13:07:18
阅读次数:
257
对标题党新闻识别技术的相关知识进行研究和总结,包括网页去噪工作原理、向量空间模型和矩阵的奇异值分解的相关知识。了解基于潜在语义分析的标题党识别系统,学习其相关技术,包括向量空间模型的构建、基于SVD的塌陷矩阵构建模块和基于LSA算法的标题党新闻判定模块。 主要工作内容:数据集特征分析及模型训练大神给 ...
分类:
其他好文 时间:
2018-02-23 12:06:59
阅读次数:
184
MNIST数据集上简单CNN实现 觉得有用的话,欢迎一起讨论相互学习~ "Follow Me" 参考文献 Tensorflow机器学习实战指南 源代码请点击下方链接欢迎加星 "Tesorflow实现基于MNIST数据集上简单CNN" 少说废话多写代码 下载并读取MNIST数据集 构造模型 训练模型 ...
分类:
其他好文 时间:
2018-02-11 22:35:10
阅读次数:
689
利用 dlib 和 sklearn 机器学习模型,训练和测试笑脸检测模型 ...
分类:
编程语言 时间:
2018-01-28 14:38:54
阅读次数:
578
Spark中的CrossValidation Spark中采用是k折交叉验证 (k-fold cross validation)。举个例子,例如10折交叉验证(10-fold cross validation),将数据集分成10份,轮流将其中9份做训练1份做验证,10次的结果的均值作为对算法精度的估 ...
分类:
其他好文 时间:
2018-01-18 17:12:27
阅读次数:
206
人脸关键点检测的技术在很多领域上都有应用,Dlib也给出了完整的模型训练的代码。但是生成的模型十分庞大。很难直接在移动端设备上应用。 本文中对Dlib的人脸关键点模型的存储结构和压缩策略进行分析,最终在性能几乎不变的情况下,得到模型的至少10倍的压缩比。 ...
分类:
其他好文 时间:
2018-01-10 13:54:28
阅读次数:
245
逻辑回归(Logistic regression): 想要理解LR,只需要记住: Sigmoid 函数: y=1/(1+e-z) 线性回归模型: y=wTx+b 最后: y= 1/(1+e-(wTx+b)) 推导为: ln (y/1-y)=wTx+b 它就是用线性回归模型的预测结果去逼近真实标记的对 ...
分类:
其他好文 时间:
2017-12-29 12:24:58
阅读次数:
164
首先,为什么要交叉验证:目的有两个: 1.选择合适的模型 2.选择合适的参数 1.对于一个问题,可以用模型m1,m2,不知道哪个的准确率高,可以交叉验证一下,从而选择用哪个 2.对于一个模型,参数的选择会影响结果,所以用交叉验证选择最合适的参数 然后,常用的交叉验证的方式是k折交叉验证(k-fold ...
分类:
其他好文 时间:
2017-12-26 17:56:00
阅读次数:
203