码迷,mamicode.com
首页 > 编程语言 > 详细

《利用python进行数据分析》读书笔记--第七章 数据规整化:清理、转换、合并、重塑(二)

时间:2015-12-11 22:21:16      阅读:200      评论:0      收藏:0      [点我收藏+]

标签:

3、数据转换

介绍完数据的重排之后,下面介绍数据的过滤、清理、以及其他转换工作。

  • 去重
#-*- encoding: utf-8 -*-
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pandas import Series,DataFrame

#DataFrame去重
data = DataFrame({k1:[one]*3 + [two] * 4,
    k2:[1,1,2,3,3,4,4,]})
#print data
print data.duplicated() #返回一个布尔型Series,重复的为True,不重复的为False
#得到去重之后的DataFrame,应该意识到这是非常常用的
print data.drop_duplicates().reset_index(drop = True)
#可以选定需要去重的列
print data.drop_duplicates([k1]) #默认保留第一次出现的行
print data.drop_duplicates([k1],take_last = True) #设定保留最后一个出现的行

《利用python进行数据分析》读书笔记--第七章 数据规整化:清理、转换、合并、重塑(二)

标签:

原文地址:http://www.cnblogs.com/batteryhp/p/5040342.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!