码迷,mamicode.com
首页 > 其他好文 > 详细

pandas DataFrame(1)

时间:2018-06-29 01:14:37      阅读:146      评论:0      收藏:0      [点我收藏+]

标签:介绍   nump   无法   解决   局限性   二维   情况   int   需要   

之前介绍了numpy的二维数组,但是numpy二维数组有一些局限性,比如,它数组里所有的值的类型必须相同,不能某一列是数值型,某一列是字符串型,这样会导致无法使用 mean() , std() 等方法去计算某一行或某一列.

但是,使用pandas DataFrame可以解决这一问题. pandas DataFrame也是二维数据,和pandas Series一样, pandas DataFrame也有‘索引‘这个概念,它每一列都有一个索引值:

import pandas as pd

df = pd.DataFrame({A: [0, 1, 2], B: [3, 4, 5]})
print df

# 结果:
   A  B
0  0  3
1  1  4
2  2  5

其中 ‘A‘,‘B‘ 是索引值,  [0,1,2] ,  [3,4,5] 是索引对应的数据,也就是列

 

默认情况下,调用方法是在列上调用:

print df.sum()

# 结果:
A     3
B    12
dtype: int64

返回一个pandas Series

 

如果需要在行上调用方法,可以设置 axis :

print df.sum(axis=1)

# 结果:
0    3
1    5
2    7
dtype: int64

 

如果需要在整个DataFrame上调用方法,可以使用.values

print df.values.sum()

# 结果:
15

 

pandas DataFrame(1)

标签:介绍   nump   无法   解决   局限性   二维   情况   int   需要   

原文地址:https://www.cnblogs.com/liulangmao/p/9241469.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!