码迷,mamicode.com
首页 > 其他好文 > 详细

Numpy - Pandas - Matplot 功能与函数名 速查

时间:2017-05-18 20:11:33      阅读:181      评论:0      收藏:0      [点我收藏+]

标签:整数   网上   中文   根据   series   esc   判断   返回   功能   

用Python做数据分析,涉及到的函数实在是太多了,容易忘记,去网上查中文基本上差不到,英文有时候描述不清楚问题。

这里搞个针对个人习惯的函数汇总速查手册,下次需要用一个什么功能,就在这里面查到对应的函数名字,然后取搜索具体用法。随时更新。

 

Numpy

创建:

创建一个随机数组x*y:

np.empty(x,y)

 

 

-----------Pandas----------

Series

判断是否是唯一的值:

obj.unique()

统计值:

obj.value_counts()

 

 

DataFrame:

根据一个列或者多个列进行排序 

frame.sort_values(by=[‘a‘,‘b‘])

删除列/删除行

del frame[‘a‘]

del frame[3]

对整个表应用操作f

frame.apply(f)

对列进行重新排序/重排:

frame.colomns = [‘b‘,‘c‘,‘a‘]

对每列求和

frame.sum()

对每行求和

frame.sum(axis=1)

求累计和,就是加上前几行的数据的总和

frame.cumsum()

求每列最大值的索引

frame.idxmax() 返回索引

frame.argmax() 返回一个整数值 

求每行最大值的索引

frame.idxmax(axis=1)

对每一列进行汇总统计(包括 计数/均值/方差/最小值/分位点/最大值)

frame.describe()

 

缺失数据/缺失处理:

 

删除缺失数据(NaN):

丢掉数据:dropna

只丢掉全为空的列: data.dropna(axis=1,how=‘all‘)

用指定值填充:fillna

对每个位置判断有无缺失: isnull , notnull

 

填充缺失数据(NaN):

用指定值填充:

data.fiina(1) 

用平均值填充:

data.fillna(data.mean())

 

Numpy - Pandas - Matplot 功能与函数名 速查

标签:整数   网上   中文   根据   series   esc   判断   返回   功能   

原文地址:http://www.cnblogs.com/denggaoshan/p/6874967.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!