码迷,mamicode.com
首页 > Web开发 > 详细

Pandas学习之常用函数详解

时间:2017-08-07 23:17:55      阅读:405      评论:0      收藏:0      [点我收藏+]

标签:

本文和大家分享的主要是Pandas库常用函数相关内容,一起来看看吧,希望对大家学习Pandas有所帮助。
1. DataFrame 处理缺失值 pandas.DataFrame.dropna
df2.dropna(axis=0, how=’any’, subset=[u’ToC’], inplace=True)
把在ToC列有缺失值的行去掉
2. 根据某维度计算重复的行 pandas.DataFrame.duplicated
print df.duplicated([’name’]).value_counts()  # 如果不指定列,默认会判断所有列"""
输出:
False    11118
True       664
表示有664行是重复的
"""
利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否为重复行,非重复行显示为False,重复行显示为True
3. 去重 pandas.DataFrame.drop_duplicates
df.drop_duplicates([’name’], keep=’last’, inplace=True)"""
keep : {‘first’, ‘last’, False}, default ‘first
first : Drop duplicates except for the first occurrence.
last : Drop duplicates except for the last occurrence.
False : Drop all duplicates."""
来源:博客园

Pandas学习之常用函数详解

标签:

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
jiangjie190
加入时间:2016-02-19
  关注此人  发短消息
文章分类
jiangjie190”关注的人------(0
jiangjie190”的粉丝们------(1
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!