码迷,mamicode.com
首页 > 编程语言 > 详细

利用Python进行数据分析-Pandas(第五部分-数据规整:聚合、合并和重塑)

时间:2019-12-08 10:55:48      阅读:97      评论:0      收藏:0      [点我收藏+]

标签:格式   对象   rand   抽象   nbsp   span   美化   应用   标签   

  在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析。本部分关注可以聚合、合并、重塑数据的方法。

1、层次化索引

  层次化索引(hierarchical indexing)是pandas的一项重要功能,它使你能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你能以低纬度形式处理高纬度数据。我们来看一个简单的栗子:创建一个Series,并用一个由列表或数组组成的列表作为索引:

data = pd.Series(np.random.randn(9), index=[[a, a, a, b, b, c, c, d, d], [1, 2, 3, 1, 3, 1, 2, 2, 3]])
print(data)
a  1   -1.624220
   2   -1.061747
   3    0.895593
b  1   -2.702315
   3   -1.690189
c  1    2.608471
   2    1.167507
d  2    0.139161
   3    1.298629
dtype: float64

看到的结果是经过美化的带有MultiIndex索引的Series的格式。索引之间的“间隔”表示“直接使用上面的标签”:

print(data.index)
MultiIndex([(‘a‘, 1),
            (‘a‘, 2),
            (‘a‘, 3),
            (‘b‘, 1),
            (‘b‘, 3),
            (‘c‘, 1),
            (‘c‘, 2),
            (‘d‘, 2),
            (‘d‘, 3)],
           )

对于一个层次化索引的对象,可以使用所谓的部分索引

 

持续更新中......

利用Python进行数据分析-Pandas(第五部分-数据规整:聚合、合并和重塑)

标签:格式   对象   rand   抽象   nbsp   span   美化   应用   标签   

原文地址:https://www.cnblogs.com/lsyb-python/p/12004531.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!