对抗训练 对抗训练是防御对抗样本攻击的一种方法。将对抗样本和正常样本一起训练是一种有效的正则化,可以提高模型的准确度,同时也能有效降低对抗样本的攻击成功率。不过这种防御也只是针对同样用来产生训练集中的对抗样本的方法。 探索网络对底层任务的理解层次,通过对抗训练减少原有独立同分布的测试集的错误率——在 ...
分类:
其他好文 时间:
2020-06-25 23:23:40
阅读次数:
67
Target Leakage:在准备数据的时候,或者数据采样的时候出了问题,误将与结果直接相关的feature纳入了数据集。 一般target leakage会导致数据在训练集上表现很好,但是当运用到实际上时,表现会很差。 举个例子, Imagine you want to predict who ...
分类:
其他好文 时间:
2020-06-23 11:38:47
阅读次数:
356
基本思路 Adaboost体现的是“三个臭皮匠,胜过一个诸葛亮”,它是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器), 然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。训练过程如下(参考Andy的机器学习--浅析Adaboost算法,他说得非常形象,贴切。) ...
分类:
编程语言 时间:
2020-06-17 20:12:02
阅读次数:
45
1、什么是回归算法 回归算法是监督型算法的一种,通过利用测试集数据来建立模型,再利用这个模型训练集中的数据进行处理的算法。线性回归旨在寻找到一根线,这个线到到达所有样本点的距离的和是最小的。常用在预测和分类领域。 2、回归和分类的区别: 3、机器学习回归算法可以干什么? (1)房价预测 (2)销售额 ...
分类:
编程语言 时间:
2020-06-16 13:11:59
阅读次数:
57
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 21:00:02
阅读次数:
64
1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, ...
分类:
其他好文 时间:
2020-06-14 20:45:45
阅读次数:
70
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 20:38:09
阅读次数:
60
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 20:37:29
阅读次数:
51
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 16:59:47
阅读次数:
52
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 16:52:22
阅读次数:
84