python:pandas学习笔记

时间：2018-03-01 17:21:33 阅读：149 评论：0 收藏：0 [点我收藏+]

import pandas
sub_info = pandas.read_csv("contract.csv")
#sub_info
#print (sub_info)
type(sub_info)
#print (sub_info.dtypes)

first_rows = sub_info.head(1)
#print (first_rows)
#print (sub_info.columns)
#print (sub_info.shape)
#print (sub_info.loc[1])
sub_info.loc[0:3]

two_five_nine = [2,5,9]
sub_info.loc[two_five_nine]

id1 = sub_info["CONTRACTID"]
id1

str1 = ["CONTRACTID","STATUS"]
id2 = sub_info[str1]
id2

sub_info.columns
columns_list = sub_info.columns.tolist()

time_list = []
for i in columns_list:
    if i.endswith("TIME"):
        time_list.append(i)

time_info = sub_info[time_list]

is_value_empty = time_info.isnull()
is_value_empty
time_info.fillna("0")

#用前一个数据代替NaN：method=‘pad‘
time_info.fillna(method=‘pad‘)
#与pad相反，bfill表示用后一个数据代替NaN
time_info.fillna(method=‘bfill‘)
#用limit限制每列可以替代NaN的数目
time_info.fillna(method=‘bfill‘,limit=1)
#使用平均数代替NaN
time_info.fillna(time_info.mean())
#指定列 数据代替NaN
time_info.fillna(time_info.mean()[‘SUBTIME‘:‘OPRTIME‘])

python:pandas学习笔记

标签：python pandas 人工智能

原文地址：http://blog.51cto.com/devops2016/2074311

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行