利用Python进行数据分析-Pandas(第五部分-数据规整：聚合、合并和重塑)

时间：2019-12-08 10:55:48 阅读：97 评论：0 收藏：0 [点我收藏+]

　　在许多应用中，数据可能分散在许多文件或数据库中，存储的形式也不利于分析。本部分关注可以聚合、合并、重塑数据的方法。

1、层次化索引

　　层次化索引（hierarchical indexing）是pandas的一项重要功能，它使你能在一个轴上拥有多个（两个以上）索引级别。抽象点说，它使你能以低纬度形式处理高纬度数据。我们来看一个简单的栗子：创建一个Series，并用一个由列表或数组组成的列表作为索引：

data = pd.Series(np.random.randn(9), index=[[‘a‘, ‘a‘, ‘a‘, ‘b‘, ‘b‘, ‘c‘, ‘c‘, ‘d‘, ‘d‘], [1, 2, 3, 1, 3, 1, 2, 2, 3]])
print(data)

a  1   -1.624220
   2   -1.061747
   3    0.895593
b  1   -2.702315
   3   -1.690189
c  1    2.608471
   2    1.167507
d  2    0.139161
   3    1.298629
dtype: float64

看到的结果是经过美化的带有MultiIndex索引的Series的格式。索引之间的“间隔”表示“直接使用上面的标签”：

print(data.index)

MultiIndex([(‘a‘, 1),
            (‘a‘, 2),
            (‘a‘, 3),
            (‘b‘, 1),
            (‘b‘, 3),
            (‘c‘, 1),
            (‘c‘, 2),
            (‘d‘, 2),
            (‘d‘, 3)],
           )

对于一个层次化索引的对象，可以使用所谓的部分索引

持续更新中......

利用Python进行数据分析-Pandas(第五部分-数据规整：聚合、合并和重塑)

标签：格式对象 rand 抽象 nbsp span 美化应用标签

原文地址：https://www.cnblogs.com/lsyb-python/p/12004531.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行