码迷,mamicode.com
首页 >  
搜索关键字:机器学习实战    ( 429个结果
机器学习实战基础(二十七):sklearn中的降维算法PCA和SVD(八)PCA对手写数字数据集的降维
PCA对手写数字数据集的降维 1. 导入需要的模块和库 from sklearn.decomposition import PCA from sklearn.ensemble import RandomForestClassifier as RFC from sklearn.model_select ...
分类:编程语言   时间:2020-05-30 23:26:07    阅读次数:114
机器学习实战基础(二十六):sklearn中的降维算法PCA和SVD(七) 附录
...
分类:编程语言   时间:2020-05-29 19:37:34    阅读次数:75
机器学习实战基础(二十三):sklearn中的降维算法PCA和SVD(四) PCA与SVD 之 PCA中的SVD
PCA中的SVD 1 PCA中的SVD哪里来? 细心的小伙伴可能注意到了,svd_solver是奇异值分解器的意思,为什么PCA算法下面会有有关奇异值分解的参数?不是两种算法么?我们之前曾经提到过,PCA和SVD涉及了大量的矩阵计算,两者都是运算量很大的模型,但其实,SVD有一种惊人的数学性质,即是 ...
分类:编程语言   时间:2020-05-29 17:46:29    阅读次数:69
机器学习实战基础(十七):sklearn中的数据预处理和特征工程(十)特征选择 之 Embedded嵌入法
Embedded嵌入法 嵌入法是一种让算法自己决定使用哪些特征的方法,即特征选择和算法训练同时进行。在使用嵌入法时,我们先使用某些机器学习的算法和模型进行训练,得到各个特征的权值系数,根据权值系数从大到小选择特征。 这些权值系数往往代表了特征对于模型的某种贡献或某种重要性,比如决策树和树的集成模型中 ...
分类:其他好文   时间:2020-05-29 13:49:27    阅读次数:57
机器学习实战基础(十六):sklearn中的数据预处理和特征工程(九)特征选择 之 Filter过滤法(三) 总结
过滤法总结 到这里我们学习了常用的基于过滤法的特征选择,包括方差过滤,基于卡方,F检验和互信息的相关性过滤,讲解了各个过滤的原理和面临的问题,以及怎样调这些过滤类的超参数。通常来说,我会建议,先使用方差过滤,然后使用互信息法来捕捉相关性,不过了解各种各样的过滤方式也是必要的。所有信息被总结在下表,大 ...
分类:其他好文   时间:2020-05-29 13:33:00    阅读次数:102
机器学习实战基础(十五):sklearn中的数据预处理和特征工程(八)特征选择 之 Filter过滤法(二) 相关性过滤
相关性过滤 方差挑选完毕之后,我们就要考虑下一个问题:相关性了。 我们希望选出与标签相关且有意义的特征,因为这样的特征能够为我们提供大量信息。如果特征与标签无关,那只会白白浪费我们的计算内存,可能还会给模型带来噪音。在sklearn当中,我们有三种常用的方法来评判特征与标签之间的相关性:卡方,F检验 ...
分类:其他好文   时间:2020-05-29 13:27:44    阅读次数:149
机器学习实战基础(十八):sklearn中的数据预处理和特征工程(十一)特征选择 之 Wrapper包装法
Wrapper包装法 包装法也是一个特征选择和算法训练同时进行的方法,与嵌入法十分相似,它也是依赖于算法自身的选择,比如coef_属性或feature_importances_属性来完成特征选择。但不同的是,我们往往使用一个目标函数作为黑盒来帮助我们选取特征,而不是自己输入某个评估指标或统计量的阈值 ...
分类:移动开发   时间:2020-05-29 13:24:47    阅读次数:159
机器学习实战基础(十二):sklearn中的数据预处理和特征工程(五) 数据预处理 Preprocessing & Impute 之 处理分类特征:处理连续性特征 二值化与分段
处理连续性特征 二值化与分段 sklearn.preprocessing.Binarizer根据阈值将数据二值化(将特征值设置为0或1),用于处理连续型变量。大于阈值的值映射为1,而小于或等于阈值的值映射为0。默认阈值为0时,特征中所有的正值都映射到1。二值化是对文本计数数据的常见操作,分析人员可以 ...
分类:其他好文   时间:2020-05-28 16:24:21    阅读次数:80
机器学习实战基础(七):创建多项式回归器
简介 线性回归模型有一个主要的局限性,那就是它只能把输入数据拟合成直线,而多项式回归模型通过拟合多项式方程来克服这类问题,从而提高模型的准确性。 准备工作 从图1-6中可以看到,数据点本身的模式中带有自然的曲线,而线性模型是不能捕捉到这一点的。再来看看多项式模型的效果,如图1-7所示。 图1-7中的 ...
分类:其他好文   时间:2020-05-28 13:16:00    阅读次数:80
[机器学习实战-Logistic回归]使用Logistic回归预测各种实例
[机器学习实战 Logistic回归]使用Logistic回归预测各种实例 [toc] "本实验代码已经传到gitee上,请点击查收!" "Logistic_Examples" 一、实验目的 1. 学习Logistic回归的基本思想。 2. Sigmoid函数和Logistic回归分类器。 3. 学 ...
分类:其他好文   时间:2020-04-29 18:10:36    阅读次数:60
429条   上一页 1 2 3 4 ... 43 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!