码迷,mamicode.com
首页 > 其他好文 > 详细

数据处理常用

时间:2019-04-26 13:19:21      阅读:153      评论:0      收藏:0      [点我收藏+]

标签:enc   ast   重置   frame   column   data   encoding   lis   索引数据   

1,dataframe获取列名称

dataframe.columns.values.tolist()

2,dataframe转化为numpy

dataframe.values

转化为数组后可以进行数值计算

3,numpy转化为列表

list = numpy.tolist()

4,进行数组运算时如果有字符串(null),肯定会报错str和list不能进行运算

通过以下办法将空字符串转化为0

datas = pd.read_csv(‘negative.csv‘, encoding=‘utf-8‘, low_memory=False)
datas.loc[datas[‘dou_01‘] == ‘(null)‘, ‘dou_01‘] = 0
datas[‘dou_01‘] = datas[‘dou_01‘].astype(‘float‘)
data11_dou_01 = datas[‘dou_01‘].values

5,header=None设置是否使用文件index为列名,使用这参数就表示不用,那列名就被认为是数值,将不能通过引用列名索引数据

6,重置列名,注意重置的列名要与data的列数据匹配上

data.columns=[‘user_id‘,‘hlw_all3‘,‘vedio_app_time‘,‘game_app_time‘,‘read_app_time‘,‘music_app_time‘,‘dm_app_time‘,‘toutiao_app_time‘]

数据处理常用

标签:enc   ast   重置   frame   column   data   encoding   lis   索引数据   

原文地址:https://www.cnblogs.com/aixiao07/p/10773462.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!