第十五节 pandas建立时间索引

时间：2020-03-25 01:08:34 阅读：63 评论：0 收藏：0 [点我收藏+]

import pandas as pd
pd.options.display.max_rows = 10  # 设置显示行数

df1 = pd.read_csv(r‘E:\anacondatest\PythonData\PM25\Beijing_2009_HourlyPM25_created20140709.csv‘, encoding=‘gbk‘)

# 将数据转换成时间戳类型
pd.Timestamp(df1["Date（LST）"][0])

# 建立datetimeindex对象
df1idx = df1.set_index(pd.to_datetime(df1["Date（LST）"]))

# 基于索引的快速切片操作
print(df1idx["2018-11-1":"2018-11-5"])

# 对时间序列做基本处理
print(df1idx.index.hour)  # 直接取出索引的相应层级
df1idx.groupby(df1idx.index.month).max()  # 直接用groupby汇总

# 序列缺失值处理，使用reindex
df2idx = df1.set_index(pd.to_datetime(df1["Date（LST）"]))  # 设置索引
idx = pd.date_range(start=‘2009-2-1 00:00:00‘, end=‘2009-12-31 00:00:00‘)  # 自定义一个索引序列
df2idx.reindex(idx)  # 重置索引为自定义的索引
df2idx[df2idx.index.duplicated()]  # 数据查重
df2idx[~df2idx.index.duplicated()].reindex(idx, method=‘bfill‘)  # 将去重后的数据重新作为索引

第十五节 pandas建立时间索引

标签：索引 span 对象 options 快速 mon 基于 gbk 时间戳

原文地址：https://www.cnblogs.com/kogmaw/p/12563486.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行