码迷,mamicode.com
首页 > 其他好文 > 详细

缺失值处理

时间:2019-11-12 12:50:49      阅读:109      评论:0      收藏:0      [点我收藏+]

标签:策略   rom   两种   load   技术   learn   form   from   standards   

在日常的处理数据的时候,会遇到数据中某些地方没有值,也就是缺失了。

对于这种情况,一半有两种情况:删除和插补。

一般步建议删除。

技术图片

 

 API:sklearn.preprocessing.Imputer

技术图片

 

参数介绍:missing_value 表示缺失值是什么;strategy 表示填补的策略,是用均值还是中值等;axis表示按照行还是列填补。

注意:数据中的人缺失值必须为np.nan,不能为?或nan等。

可以用replace函数将缺失值转换为np.nan

 

上代码:

 1 from sklearn.preprocessing import StandardScaler,Imputer
 2 import numpy as np
 3 def im():
 4     ‘‘‘
 5     缺失值处理
 6     :return:
 7     ‘‘‘
 8     im=Imputer(missing_values=NaN, strategy=mean, axis=0)
 9     data = im.fit_transform([[90,2,10,40],[np.nan,4,15,45],[75,3,13,46]])
10     print(data)
11 if __name__ == __main__:
12     im()

技术图片

 

 

缺失值处理

标签:策略   rom   两种   load   技术   learn   form   from   standards   

原文地址:https://www.cnblogs.com/GouQ/p/11840756.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!