标签:标记 技术 出现 code 方法 png dup false mamicode
数据去重可以使用duplicated()和drop_duplicates()两个方法。
DataFrame.duplicated(subset = None,keep =‘first’)返回boolean Series表示重复行
参数:
subset:列标签或标签序列,可选
仅考虑用于标识重复项的某些列,默认情况下使用所有列
keep:{‘first’,‘last’,False},默认’first’
first:标记重复,True除了第一次出现。
last:标记重复,True除了最后一次出现。
错误:将所有重复项标记为True。
标签:标记 技术 出现 code 方法 png dup false mamicode
原文地址:https://www.cnblogs.com/programmer123/p/11729763.html