Pandas

时间：2020-01-07 16:05:16 阅读：69 评论：0 收藏：0 [点我收藏+]

　　Pandas是基于Numpy构建的库，在数据处理方面可以把它理解为numpy加强版，同时Pandas也是一项开源项目。不同于numpy的是，pandas拥有种数据结构：Series和DataFrame：

技术图片

Series是一种类似一维数组的数据结构，由一组数据和与之相关的index组成，这个结构一看似乎与dict字典差不多，我们知道字典是一种无序的数据结构，而pandas中的Series的数据结构不一样，它相当于定长有序的字典，并且它的index和value之间是独立的，两者的索引还是有区别的，Series的index是可变的，而dict字典的key值是不可变的。

Series的生成方式：

1 #没有指定index，生成默认的index
2 data = Series([9527,‘btch‘,2345,‘efos‘])
3 #指定index
4 data = Series([9,5,2,7],index = [‘aa‘,‘bb‘,‘cc‘,‘dd‘])

View Code

技术图片

DataFrame这种数据结构我们可以把它看作是一张二维表，DataFrame长得跟我们平时使用的Excel表格差不多，DataFrame的横行称为columns，竖列和Series一样称为index，DataFrame每一列可以是不同类型的值集合，所以DataFrame你也可以把它视为不同数据类型同一index的Series集合。

　　DataFrame的生成与Series差不多，你可以自己指定index，也可不指定，DataFrame会自动帮你补上。

#Series的两种生成方式

Pandas

标签：二维 hide str val 默认 ram 技术 open data

原文地址：https://www.cnblogs.com/shareinfo/p/12161748.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行