码迷,mamicode.com
首页 > 移动开发 > 详细

GroupBy,Apply用法笔记

时间:2017-09-08 22:52:52      阅读:749      评论:0      收藏:0      [点我收藏+]

标签:准则   lam   元素   对象   htm   拆分   lambda   generate   array   

GroupBy针对DataFrame将其按照某个准则分组

1.常见的调用形式为:

df[a].GroupyBy(df[b])

df.GroupyBy(df[b,c])#层次化的索引

df.GroupyBy([b,c])#直接将columns名称作为索引键进行索引

以上可理解为将Series作为分组键,y此外还可以将任何适当长度的array作为分组键,目前未尝试过

2.常用的方法:

df.GroupyBy(df[b]).mean()#非数值列数据直接跳过
df.GroupyBy(df[b]).size()#返回一个分组的大小的Series(每个值对应的是当前键元素的个数)

3.举例GroupyBy的应用:

如给出的csv文件中columns包含[‘City‘,‘State‘,‘Population‘],让求出每个州所有城市人口的平均值,此时就可以用

df[population].GroupBy([State]).mean()

 

注:GroupyBy函数说明在http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html#pandas.DataFrame.groupby

 

 Apply函数-可针对DataFrame和Series操作,返回是DataFrame和Series

1.理解:apply将他应用的对象拆分到小一级,然后让拆分后的每个子部分去实施apply括号内的函数操作,再把操作后的结果合在一起

2.apply可以说是非常常用,这里只说一个基本的用例,连带理解了lambda的用法

energy[Energy Supply]=energy[Energy Supply].apply(lambda x : x*1000000)

 

注:Apply函数说明 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.apply.html#pandas.DataFrame.apply

 

GroupBy,Apply用法笔记

标签:准则   lam   元素   对象   htm   拆分   lambda   generate   array   

原文地址:http://www.cnblogs.com/sss423/p/7496461.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!