码迷,mamicode.com
首页 > 其他好文 > 详细

pandas_查看数据特征和统计信息

时间:2020-05-07 20:02:13      阅读:250      评论:0      收藏:0      [点我收藏+]

标签:额的   type   strong   python   文件   div   anti   color   读取文件   

# 查看数据特征和统计信息
import pandas as pd
# 读取文件
dataframe = pd.read_excel(rC:\Users\lenovo\Desktop\总结\Python\超市营业额.xlsx)

# 查看所有的交易额信息
dataframe[交易额].describe()
‘‘‘
count      17.000000
mean     1024.117647
std       428.019550
min       580.000000
25%       700.000000
50%       850.000000
75%      1300.000000
max      2000.000000
Name: 交易额, dtype: float64
‘‘‘
# 查看四分位数
dataframe[交易额].quantile([0,0.25,0.5,0.75,1.0])
‘‘‘
0.00     580.0
0.25     700.0
0.50     850.0
0.75    1300.0
1.00    2000.0
Name: 交易额, dtype: float64
‘‘‘
# 交易额中值
dataframe[交易额].median()
# 850.0

# 交易额最小的三个数据
dataframe[交易额].nsmallest(3)
‘‘‘
12    580
4     600
7     600
Name: 交易额, dtype: int64
‘‘‘
dataframe.nsmallest(3,交易额)
‘‘‘
      工号  姓名        日期           时段  交易额    柜台
12  1005  周七  20190302   9:00-14:00  580   日用品
4   1005  周七  20190301   9:00-14:00  600   日用品
7   1001  张三  20190302  14:00-21:00  600  蔬菜水果
‘‘‘
# 交易额最大的两个数据
dataframe[交易额].nlargest(2)
‘‘‘
0    2000
1    1800
Name: 交易额, dtype: int64
‘‘‘
# 查看最大的交易额数据
dataframe.nlargest(2,交易额)
‘‘‘
     工号  姓名        日期           时段   交易额   柜台
0  1001  张三  20190301   9:00-14:00  2000  化妆品
1  1002  李四  20190301  14:00-21:00  1800  化妆品
‘‘‘
# 查看最后一个日期
dataframe[日期].max()
# 20190303

# 查看最小的工号
dataframe[工号].min()
# 1001

# 第一个最小交易额的行下标
index = dataframe[交易额].idxmin()
# 0

# 第一个最小交易额
dataframe.loc[index,交易额]
# 580

# 最大交易额的行下标
index = dataframe[交易额].idxmax()
dataframe.loc[index,交易额]
# 2000

2020-05-07

pandas_查看数据特征和统计信息

标签:额的   type   strong   python   文件   div   anti   color   读取文件   

原文地址:https://www.cnblogs.com/hany-postq473111315/p/12844895.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!