DataFrame概念与创建

时间：2018-06-02 11:18:57 阅读：168 评论：0 收藏：0 [点我收藏+]

一 概念
Pandas是一个开源的Python数据分析库。Pandas把结构化数据分为了三类：
Series，1维序列，可视作为没有column名的、只有一个column的DataFrame；
DataFrame，同Spark SQL中的DataFrame一样，其概念来自于R语言，为多column并schema化的2维结构化数据，可视作为Series的容器（container）；
Panel，为3维的结构化数据，可视作为DataFrame的容器；

二 创建DataFrame
#  标准创建
df2 = pd.DataFrame(np.arange(16).reshape((4,4)),index=[‘a‘,‘b‘,‘c‘,‘d‘], columns=[‘one‘,‘two‘,‘three‘,‘four‘])
print "df2 =", df2

# 用传入等长列表组成的字典来创建(用DataFrame自带索引) 自带列名
data={‘c‘:[‘1‘,‘2‘],‘a‘:[‘5‘,‘6‘]}
df=pd.DataFrame(data)
print "df =", df

# 传入嵌套字典（字典的值也是字典）创建DataFrame (使用字典内嵌索引) 自带列名
nest_dict = {‘shanghai‘: {2015: 100, 2016: 101}, ‘beijing‘: {2015: 102, 2016: 103}}
df1=pd.DataFrame(nest_dict)
print "df1 =", df1

# 传入Series (带大括号，另外需加列名)
list = [‘1‘, ‘2‘, ‘3‘, ‘4‘]
s= pd.Series(list, index=[‘a‘, ‘b‘, ‘c‘, ‘d‘])
df1=pd.DataFrame({"A": s})
print "df1 =", df1
print df1

三

DataFrame概念与创建

标签：dict 内嵌 IV 序列结构 sha pytho dex series

原文地址：https://www.cnblogs.com/chengxin1982/p/9124320.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行