码迷,mamicode.com
首页 > 其他好文 > 详细

机器学习——08、特征选择

时间:2020-04-29 11:02:11      阅读:60      评论:0      收藏:0      [点我收藏+]

标签:tran   com   指标   turn   alt   src   技术   div   学习   

用过滤法对以下数据进行特征选择:

                             [[0,2,0,3],

                              [0,1,4,3],

                              [0,1,1,3]]

要求:

1、Variance Threshold(threshold =1.0)

2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的

特征选择的原因:

①冗余:部分特征的相关度搞,容易消耗计算性能

②噪音:部分特征对预测结果有影响。

这里的特征选择就是降低维度,即选择最合适的特征数量,过滤式筛选指标是方差大小。

步骤:①初始化variance threshold,指定阈值方差。②调用fit_transform。

 源代码:

#过滤式特征选择
from sklearn.feature_selection import VarianceThreshold

def var():
    #特征选择-删除低方差的特征

    var=VarianceThreshold(threshold=1.0)  #初始化variance threshold,指定阈值方差
    data=var.fit_transform([[0,2,0,3],[0,1,4,3],[0,1,1,3]])   #调用fit_transform

    print(data)
    return None

if __name__ == "__main__":
    var();

技术图片

 

                                                                                                       图1 阈值方差为1的结果

技术图片

 

                                                                                                      图2 阈值方差为0的结果

机器学习——08、特征选择

标签:tran   com   指标   turn   alt   src   技术   div   学习   

原文地址:https://www.cnblogs.com/lcj170/p/12799725.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!