码迷,mamicode.com
首页 > 其他好文 > 详细

pandas如何去掉时间列的小时只保留日期

时间:2018-05-06 22:53:53      阅读:567      评论:0      收藏:0      [点我收藏+]

标签:分享图片   alt   only   分享   想去   use   去除   class   question   

最近无聊,想玩玩数据挖掘,就拿天池的天池新人实战赛之[离线赛]练练手。https://tianchi.aliyun.com/getStart/information.htm?spm=5176.100067.5678.2.2b282b2bAOqNmy&raceId=231522 

其中在处理数据时,我需要以日期为索引,比如将前6天的数据作为训练集,第7天的数据作为预测集。下图是阿里给的数据。

技术分享图片

由于我们需要按天来统计数据,所以暂时认为几点购买的这个信息没什么用,我想去掉。要怎么去掉呢?

技术分享图片

我们可以看到,时间列是object类型,先对其进行转换。

技术分享图片

然后这里有两种方法去除时间:

技术分享图片

上图的第二句话是设置时间为索引。

第二种方法:

all_user[‘time‘] = pd.to_datetime(all_user[‘time‘]).dt.date 
这种方法很慢,请不要轻易尝试。具体可以参考:https://stackoverflow.com/questions/16176996/keep-only-date-part-when-using-pandas-to-datetime。
然后我们就可以分割数据为训练集和预测集了。
train_user = all_user[‘2014-11-22‘:‘2014-11-27‘]
train_user_predict = all_user[‘2014-11-28‘]
valid_user = all_user[‘2014-11-29‘:‘2014-12-04‘]
valid_user_predict = all_user[‘2014-12-05‘]
test_user = all_user[‘2014-12-13‘:‘2014-12-18‘]
test_user_predict = all_user[‘2014-12-19‘]

pandas如何去掉时间列的小时只保留日期

标签:分享图片   alt   only   分享   想去   use   去除   class   question   

原文地址:https://www.cnblogs.com/subic/p/9000129.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!