码迷,mamicode.com
首页 > 其他好文 > 详细

pandas

时间:2018-07-27 01:34:28      阅读:187      评论:0      收藏:0      [点我收藏+]

标签:frame   理解   数据   属性   返回值   生产   print   bsp   之间   

pandas提供了

1.便于操作的数据类型

2.提供了很多分析函数和分析工具

import pandas as pd
d = pd.Series(range(20))
# print(d)
print(d.cumsum())

padas库的理解

两个数据类型:Series(一维),DataFrame(多维)

关注数据的应用表达,数据和索引之间的关系

 

series:理解为带标签数组

可以通过标量创建

s = pd.Series(5,index=[x,y,z])
print(s)

可以通过字典创建

s = pd.Series({x:1,y:2,z:3})
print(s)
s = pd.Series({x:1,y:2,z:3},index=[z,s,c,x,y])
print(s)

可以通过ndarrary创建

import pandas as pd
import numpy as np
b = pd.Series(np.arange(1,10))
print(b)
import pandas as pd
import numpy as np
b = pd.Series(np.arange(1,4),index=np.arange(9,4,-2))
print(b)

方法

.index   获得索引

.values 获得数据

import pandas as pd
import numpy as np
b = pd.Series(np.arange(1,4),index=np.arange(9,4,-2))
print(b.index)

由此可以得知Series类型就是index类型+ndarray类型

s = pd.Series({x:1,y:2,z:3},index=[z,s,c,x,y])
# print(s)
print(s[x])
print(s[0])  #此数可以得知数字索引是默认生产的
#两套索引可以并存但是不可以混用

可以使用ndarray的方法以及切片

s = pd.Series({x:1,y:2,z:3},index=[z,s,c,x,y])
print(s[s>s.median()])
print(np.exp(s))
print(s[:3])

可以使用字典中的in和.get方法

in判断的是:是不是索引的一部分

.get(a,b)若存在索引a返回值,不存在返回b

 

Series+Series:索引对应的值相加,索引自动对齐,如果索引只存在一个Series里相加得到的是NaN

a = pd.Series([1,2,3],[a,b,c])
b = pd.Series([4,5,6],[b,c,d])
c = a+b
print(c) 

#a    NaN
#b    6.0
#c    8.0
#d    NaN
#dtype: float64

属性:

a.name可以存贮在Series中

随时更改,即时生效

pandas

标签:frame   理解   数据   属性   返回值   生产   print   bsp   之间   

原文地址:https://www.cnblogs.com/zsc329/p/9374842.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!