码迷,mamicode.com
首页 >  
搜索关键字:特征工程    ( 223个结果
【百面】01_特征工程
《百面机器学习》这本书真的是太好了,忍不住要记录一下学习过程中的所思所想。文章内容仅做适当摘取和记录,如有所需,请购书!另外,本文中所摘抄的内容,仅是个人认为比较重要的地方(实际上是想学习的内容)。比如NLP有关的东西,实在是打不起兴趣,舍去了... 机器学习是要和数据打交道,数据如何表征?如何将数 ...
分类:其他好文   时间:2020-07-06 10:46:01    阅读次数:62
NLP的文本分析与特征工程
作者|Mauro Di Pietro 编译|VK 来源|Towards Data Science 摘要 在本文中,我将使用NLP和Python解释如何为机器学习模型分析文本数据和提取特征。 自然语言处理(NLP)是人工智能的一个研究领域,它研究计算机与人类语言之间的相互作用,特别是如何对计算机进行编 ...
分类:其他好文   时间:2020-07-02 16:19:36    阅读次数:51
二手车定价:
二手车定价: 天池_二手车价格预测_Task4_建模调参 - 柯摩的文章 - 知乎 https://zhuanlan.zhihu.com/p/142265877 天池_二手车价格预测_Task_3_特征工程 - 柯摩的文章 - 知乎 https://zhuanlan.zhihu.com/p/1231 ...
分类:其他好文   时间:2020-06-28 13:29:11    阅读次数:71
featuretools入门
featuretools入门尝试 简介 特征工程中最重要的一步,是对baseline提升最大的一个步骤,对数据的EDA以及构建特征,是不可缺少一部分。python的特征工程常用agg与groupby的进行聚合统计。 首先,我们得先了解一下featuretools的3个基本组成 实体集(EntityS ...
分类:其他好文   时间:2020-06-08 10:52:37    阅读次数:154
机器学习实战基础(十七):sklearn中的数据预处理和特征工程(十)特征选择 之 Embedded嵌入法
Embedded嵌入法 嵌入法是一种让算法自己决定使用哪些特征的方法,即特征选择和算法训练同时进行。在使用嵌入法时,我们先使用某些机器学习的算法和模型进行训练,得到各个特征的权值系数,根据权值系数从大到小选择特征。 这些权值系数往往代表了特征对于模型的某种贡献或某种重要性,比如决策树和树的集成模型中 ...
分类:其他好文   时间:2020-05-29 13:49:27    阅读次数:57
机器学习实战基础(十六):sklearn中的数据预处理和特征工程(九)特征选择 之 Filter过滤法(三) 总结
过滤法总结 到这里我们学习了常用的基于过滤法的特征选择,包括方差过滤,基于卡方,F检验和互信息的相关性过滤,讲解了各个过滤的原理和面临的问题,以及怎样调这些过滤类的超参数。通常来说,我会建议,先使用方差过滤,然后使用互信息法来捕捉相关性,不过了解各种各样的过滤方式也是必要的。所有信息被总结在下表,大 ...
分类:其他好文   时间:2020-05-29 13:33:00    阅读次数:102
机器学习实战基础(十五):sklearn中的数据预处理和特征工程(八)特征选择 之 Filter过滤法(二) 相关性过滤
相关性过滤 方差挑选完毕之后,我们就要考虑下一个问题:相关性了。 我们希望选出与标签相关且有意义的特征,因为这样的特征能够为我们提供大量信息。如果特征与标签无关,那只会白白浪费我们的计算内存,可能还会给模型带来噪音。在sklearn当中,我们有三种常用的方法来评判特征与标签之间的相关性:卡方,F检验 ...
分类:其他好文   时间:2020-05-29 13:27:44    阅读次数:149
机器学习实战基础(十八):sklearn中的数据预处理和特征工程(十一)特征选择 之 Wrapper包装法
Wrapper包装法 包装法也是一个特征选择和算法训练同时进行的方法,与嵌入法十分相似,它也是依赖于算法自身的选择,比如coef_属性或feature_importances_属性来完成特征选择。但不同的是,我们往往使用一个目标函数作为黑盒来帮助我们选取特征,而不是自己输入某个评估指标或统计量的阈值 ...
分类:移动开发   时间:2020-05-29 13:24:47    阅读次数:159
机器学习实战基础(十二):sklearn中的数据预处理和特征工程(五) 数据预处理 Preprocessing & Impute 之 处理分类特征:处理连续性特征 二值化与分段
处理连续性特征 二值化与分段 sklearn.preprocessing.Binarizer根据阈值将数据二值化(将特征值设置为0或1),用于处理连续型变量。大于阈值的值映射为1,而小于或等于阈值的值映射为0。默认阈值为0时,特征中所有的正值都映射到1。二值化是对文本计数数据的常见操作,分析人员可以 ...
分类:其他好文   时间:2020-05-28 16:24:21    阅读次数:80
MNIST实例-Tensorflow 初体验
体验一下 TensorFlow 导包套路, 获取数据 - 特征工程, 构建网络, 模型训练, 计算梯度, 梯度更新 .. Epoch ..这些流程操作. ...
分类:其他好文   时间:2020-05-23 18:35:46    阅读次数:54
223条   上一页 1 2 3 4 5 ... 23 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!