标签:frame load inf mamicode image src nan ast ima
Pandas基于两种数据类型: series 与 dataframe
Series:是一个一维的数据类型
DataFrame:是一个二维的表结构
选择/切片
df[‘code‘] # 选取一列,生成一个Series
df[[‘code‘]] # 选取一列,生成一个DataFrame
df[[‘code‘, ‘unit‘]] # 选取多列
df[1:3] #第1行到第2行(不含第3行)
loc,在知道列名字的情况下,df.loc[index,column] 选取指定行,列的数据
iloc完全用数字来定位 iloc[row_index, column_index]
isin 过滤
df[df[‘unit‘].isin([‘1单元‘])
缺省项
# pandas 中使用np.nan作为缺省项的值
# 删除所有带有缺省项的行 :df.dropna(how = ‘any)
# 填充缺省项:df.fillna(value = 7)
# 获得缺省项的布尔掩码:pd.isnull(df)
观察操作
# 前几行数据
df.head()
# 显示索引
df.index
# 显示列
df.columns
# 转置
df.T
参考文档:http://www.data-master.net/80533003
标签:frame load inf mamicode image src nan ast ima
原文地址:https://www.cnblogs.com/yu121/p/13140020.html