码迷,mamicode.com
首页 > 其他好文 > 详细

AutoML学习---机器学习01

时间:2019-05-26 15:45:03      阅读:115      评论:0      收藏:0      [点我收藏+]

标签:编码   arch   分析   png   分布   ima   col   个数   控制器   

一、机器学习

 1、机器学习框架

  技术图片

  转换为网络结构,如下图所示:

 技术图片

2、框架分析

 (1)数值特性:

  ① 连续特征:log1P、|x| 、ex、归一化、离散化、顺序号等。

  ② 离散特征:频率、目标编码、One-hot 编码、合并、Label-Encoder 等。

(2)特征提取(以文本为例):

技术图片

  特征特征提取与特征选择有很大的不同:前者包括将任意数据(如文本或图像)转换为可用于机器学习的数值特征。后者是将这些特征应用到机器学习中。

(3)交叉特征:

  ① 文本交叉特征:文本相似度、N-gram 集合关系、词向量差、子串匹配、模糊匹配等。

  ② 数值交叉特征:a-b 、|a-b| 、a>b 、a*b 、 a/b 、 (a-b)2 等。

(4)特征选择、降维:

  ① 特征选择:Stepwise Regression(逐步回归)、特征重要性 ;

  ② 随机投影:Locality-Sensitive Hashing 、随机投影 ;

  注:随机投影矩阵的维度和分布是受控制的,所以可以保存任意两个数据集的距离。因此随机投影适用于基于距离的方法。

  ③ 线性投影:PCA(主分量分析)、LDA(线性判别分析);

  ④ 非线性投影:Auto-Encoder(自动编码??)、GDA(标准广义判别分析)。

 (5)模型选择、调参:

  ① 模型选择:暴力搜索 ;

  ② 超参数选择:网格搜索、随机搜索、Bayes Optimization(贝叶斯优化)。

二、深度学习

1、深度学习框架

技术图片

  转换为网络结构,如下图所示:

技术图片

2、框架分析

  类似于机器学习的分析。

3、Neural Architecture Search(神经网络搜索)

技术图片

4、控制器的两种方案

技术图片

 

AutoML学习---机器学习01

标签:编码   arch   分析   png   分布   ima   col   个数   控制器   

原文地址:https://www.cnblogs.com/lifengB511/p/10926034.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!