码迷,mamicode.com
首页 > 其他好文 > 详细

groupby+agg

时间:2019-07-01 22:53:21      阅读:146      评论:0      收藏:0      [点我收藏+]

标签:问题   定义   函数   bsp   自定义函数   表格   唯一值   这一   现在   

在处理pandas表格数据时,有时会遇到这样的问题:按照某一列聚合后,判断另一列是否出现唯一值,比如安泰杯--跨境电商比赛中,某个商人的ID如果出现在两个国家(xx和yy),则要剔除这样的数据,这就需要我们按照商人ID进行groupby,然后判断国家这一列是否值唯一,不唯一则剔除。

def unique_num(x):

  return len(np.unique(x))  #自定义函数

train.groupby([‘buyer_id‘]).agg({‘country_id‘:unique_num})

 

下面对groupby和agg使用方法进行总结:

groupby+agg

标签:问题   定义   函数   bsp   自定义函数   表格   唯一值   这一   现在   

原文地址:https://www.cnblogs.com/USTC-ZCC/p/11117300.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!