码迷,mamicode.com
首页 > 其他好文 > 详细

pandas.DataFrame的groupby()方法的基本使用

时间:2019-10-04 00:22:17      阅读:477      评论:0      收藏:0      [点我收藏+]

标签:基本使用   and   panda   bsp   掌握   分析   code   style   img   

pandas.DataFrame的groupby()方法是一个特别常用和有用的方法。让我们快速掌握groupby()方法的基础使用,从此数据分析又多一法宝。

首先导入package:

import pandas as pd
import numpy as np

groupby的最基本操作

df = pd.DataFrame({A:[1,2,3,1],B:[2,3,3,6],C:[3,1,5,7]})
df

技术图片

 

 

 按照A列来进行分组(其实说白了就是将A列中重复的值和成同一个值,然后把A当成索引来进行重新的数据分组)

df.groupby(A).mean() #mean是取平均值

技术图片

df.groupby(A).sum() #sum是求和

技术图片

df.groupby([A]).first() #取第一个出现的数据

技术图片

df.groupby([A]).last() #取最后一个出现的数据

技术图片

 也可以按照多组进行分组

df.groupby([A,B]).sum()

技术图片

 

统计数据的数量 

size跟count的区别: size计数时包含NaN值,而count不包含NaN值

df = pd.DataFrame({A:[1,2,3,1],B:[2,3,3,6],C:[3,np.nan,5,7]})
df

技术图片

df.groupby([A]).count()

技术图片

df.groupby([A]).size()

技术图片

pandas.DataFrame的groupby()方法的基本使用

标签:基本使用   and   panda   bsp   掌握   分析   code   style   img   

原文地址:https://www.cnblogs.com/nsw0419/p/11620904.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!