码迷,mamicode.com
首页 > 编程语言 > 详细

python数据分析之pandas库的DataFrame应用二

时间:2016-08-11 11:18:42      阅读:176      评论:0      收藏:0      [点我收藏+]

标签:

  

  本节介绍Series和DataFrame中的数据的基本手段

  1. 重新索引

  pandas对象的一个重要方法就是reindex,作用是创建一个适应新索引的新对象

技术分享
‘‘‘
Created on 2016-8-10
@author: xuzhengzhu
‘‘‘
‘‘‘
Created on 2016-8-10
@author: xuzhengzhu
‘‘‘
from pandas import  *

print "--------------obj result:-----------------"
obj=Series([4.5,7.2,-5.3,3.6],index=[d,b,a,c])
print obj

print "--------------obj2 result:-----------------"
obj2=obj.reindex([a,b,c,d,e])
print obj2

print "--------------obj3 result:-----------------"
obj3=obj.reindex([a,b,c,d,e],fill_value=0)
print obj3
reindex

 #reindex对索引值进行重排,如果当前索引值不存在,就引入缺失值
 #可以指定fill_value=0来进行缺失值的替换

技术分享
--------------obj result:-----------------
d    4.5
b    7.2
a   -5.3
c    3.6
dtype: float64
--------------obj2 result:-----------------
a   -5.3
b    7.2
c    3.6
d    4.5
e    NaN
dtype: float64
--------------obj3 result:-----------------
a   -5.3
b    7.2
c    3.6
d    4.5
e    0.0
dtype: float64
reindex_index

 

  2.插值

  对于时间序列这样的有序数据,重新索引时可能需要做一些插值处理,method选项即可达到此目的:

对于时间序列这样的有序数据,重新索引时可能需要做一些插值处理,method选项即可达到此目的:

method参数介绍
参数 说明
ffill或pad 前向填充
bfill或backfill 后向填充

 

 

 

 

 

技术分享
‘‘‘
Created on 2016-8-10
@author: xuzhengzhu
‘‘‘
from pandas import  *

print "--------------obj3 result:-----------------"
obj3=Series([blue,red,yellow],index=[0,2,4])
print obj3

print "--------------obj4 result:-----------------"
obj4=obj3.reindex(range(6),method=ffill)

print obj4
ffill前向填充
技术分享
--------------obj3 result:-----------------
0      blue
2       red
4    yellow
dtype: object
--------------obj4 result:-----------------
0      blue
1      blue
2       red
3       red
4    yellow
5    yellow
dtype: object
ffill结果:

 

python数据分析之pandas库的DataFrame应用二

标签:

原文地址:http://www.cnblogs.com/HondaHsu/p/5760183.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!