标签:
本节介绍Series和DataFrame中的数据的基本手段
pandas对象的一个重要方法就是reindex,作用是创建一个适应新索引的新对象
‘‘‘ Created on 2016-8-10 @author: xuzhengzhu ‘‘‘ ‘‘‘ Created on 2016-8-10 @author: xuzhengzhu ‘‘‘ from pandas import * print "--------------obj result:-----------------" obj=Series([4.5,7.2,-5.3,3.6],index=[‘d‘,‘b‘,‘a‘,‘c‘]) print obj print "--------------obj2 result:-----------------" obj2=obj.reindex([‘a‘,‘b‘,‘c‘,‘d‘,‘e‘]) print obj2 print "--------------obj3 result:-----------------" obj3=obj.reindex([‘a‘,‘b‘,‘c‘,‘d‘,‘e‘],fill_value=0) print obj3
#reindex对索引值进行重排,如果当前索引值不存在,就引入缺失值
#可以指定fill_value=0来进行缺失值的替换
--------------obj result:----------------- d 4.5 b 7.2 a -5.3 c 3.6 dtype: float64 --------------obj2 result:----------------- a -5.3 b 7.2 c 3.6 d 4.5 e NaN dtype: float64 --------------obj3 result:----------------- a -5.3 b 7.2 c 3.6 d 4.5 e 0.0 dtype: float64
2.插值
对于时间序列这样的有序数据,重新索引时可能需要做一些插值处理,method选项即可达到此目的:
对于时间序列这样的有序数据,重新索引时可能需要做一些插值处理,method选项即可达到此目的:
method参数介绍 | |
参数 | 说明 |
ffill或pad | 前向填充 |
bfill或backfill | 后向填充 |
‘‘‘ Created on 2016-8-10 @author: xuzhengzhu ‘‘‘ from pandas import * print "--------------obj3 result:-----------------" obj3=Series([‘blue‘,‘red‘,‘yellow‘],index=[0,2,4]) print obj3 print "--------------obj4 result:-----------------" obj4=obj3.reindex(range(6),method=‘ffill‘) print obj4
--------------obj3 result:----------------- 0 blue 2 red 4 yellow dtype: object --------------obj4 result:----------------- 0 blue 1 blue 2 red 3 red 4 yellow 5 yellow dtype: object
python数据分析之pandas库的DataFrame应用二
标签:
原文地址:http://www.cnblogs.com/HondaHsu/p/5760183.html