码迷,mamicode.com
首页 > 编程语言 > 详细

机器学习算法

时间:2018-07-26 18:48:57      阅读:152      评论:0      收藏:0      [点我收藏+]

标签:其他   过拟合   最优   嵌入   过程   ica   分布   另一个   估算   

1.激活函数:

2.超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果

3.特征提取:

特征工程:若出现特征为字符串类型则使用独热编码

良好特征具备的特性:1.特征值应以非零值的形式在数据集中多次出现2.应该具有清晰明确的含义。3.特征不应使用“神奇”的值4.特征的定义不应随时间发生变化(注意对其他机器学习系统的依赖性)

4.特征组合:1.线性学习器可以很好的扩展到大量数据2.不使用特征组合,一些模型的表现度将受限制3.使用特征组合+大量数据是学习高度复杂模型的一种有效的策略。

5.降低损失:

6.优化学习速率:如果优化学习速率设置比较大,则一步就越过了梯度下降法到达最低点的点,每一步都在曲线上来回跳跃,沿着曲线向上爬,而不是降到底部

7.L1正则化:

  1. 稀疏性:避免了过拟合,降低内存使用
  2. 会对权重的L0范数进行惩罚

8.L2正则化:避免过拟合

  1. 降低模型的复杂度:权重的平方和
  2. 减少非常大的权重
  3. 对于线性模型:首选比较平缓的斜率
  4. 贝叶斯先验概率:权重应该以0为中心,权重应该呈正态分布

训练模型的优化算法是由一个俩项内容组成的函数:一个是损失项,用于衡量模型与数据的拟合度,另一个是正则化项,用于衡量模型复杂度(1.将模型复杂度作为模型中所有特征的权重的函数,将模型复杂度作为具有非零权重的特征总数的函数)

9.逻辑回归:二元分类,极其高效的Giallo计算机制(许多问题需要将概率估算值作为输出)俩种方式:“按原样”“转换成二元类别”应用领域:疾病自动诊断(探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等),经济预测等领域

分类:评估指标:精确率和召回率

深度神经网络:自行学习,而不需要我们手动为其添加参数,使用反向传播(TensorFlow可实现)可以将非凸函数进行梯度下降。

反向传播注意事项:1.梯度很重要2.可能会消失3.可能会爆炸(学习速率很重要)4.ReLu可能会消失5.丢弃正则化

嵌入:增加维度到模型中

二分类:ROC/AUC 评价一个二值分类的优势

人脸识别系统组成:机器学习和模式识别中的分类问题

其中的算法主要包括三个模块:1.人脸检测2.人脸对齐3.人脸特征表征

10.点击率预估算法:FFM

机器学习算法

标签:其他   过拟合   最优   嵌入   过程   ica   分布   另一个   估算   

原文地址:https://www.cnblogs.com/lgx-fighting/p/9372874.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!