码迷,mamicode.com
首页 > 其他好文 > 详细

pandas切片使用和column赋值

时间:2018-05-31 11:30:29      阅读:471      评论:0      收藏:0      [点我收藏+]

标签:ntile   命名   文本编辑器   文本编辑   基本   需要   个数   手动   tiles   

#-*- coding: utf-8 -*- 
#对数据进行基本的探索
#返回缺失值个数以及最大最小值

import pandas as pd

datafile= ../data/air_data.csv #航空原始数据,第一行为属性标签
resultfile = ../tmp/explore.xls #数据探索结果表

data = pd.read_csv(datafile, encoding = utf-8) #读取原始数据,指定UTF-8编码(需要用文本编辑器将数据装换为UTF-8编码)

explore = data.describe(percentiles = [], include = all).T #包括对数据的基本描述,percentiles参数是指定计算多少的分位数表
#(如1/4分位数、中位数等);T是转置,转置后更方便查阅
explore[null] = len(data)-explore[count] #describe()函数自动计算非空值数,需要手动计算空值数

explore = explore[[null, max, min]]
explore.columns = [u空值数, u最大值, u最小值] #表头重命名
‘‘‘这里只选取部分探索结果。
describe()函数自动计算的字段有count(非空值数)、unique(唯一值数)、top(频数最高者)、freq(最高频数)、
mean(平均值)、std(方差)、min(最小值)、50%(中位数)、max(最大值)‘‘‘

explore.to_excel(resultfile) #导出结果

 

pandas切片使用和column赋值

标签:ntile   命名   文本编辑器   文本编辑   基本   需要   个数   手动   tiles   

原文地址:https://www.cnblogs.com/ggzhangxiaochao/p/9115471.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!