标签:统计信息 推荐 numpy color 参考 cat 选择 str strong
使用格式:DataFrame.describe(percentile_width=None, percentiles=None, include=None, exclude=None)
作用:生成各种汇总统计信息,不包括代表非数字值的特殊值。
参数:
1.percentile_width:Float类型,不推荐使用
percentile_width参数将会在将来的版本中被移除,并使用percentiles替代。如果不设置percentile_width,宽度默认为50,相当于上限为75,下限为25
2.percentiles:类似数组,可选择性的使用
Percentiles参数应该在区间[0,1]之间。如果不设置percentiles,则默认为[0.25,0.5,0.75],返回25%,50%,75%分位数
3.include, exclud:类似列表,参数可选为’all’或者None
指定返回结果的形式
l 两者都缺省。结果将只包括数字类型的列,如果不存在,只包括categorical columns(分类列)。
l 包括/不包括一个dtype类型数组或者string类型数组。选定所有数值类型使用numpy numpy.number。选定所有的分类元素使用type元素。也可参考select_dtypes文档
l 如果包括字符串’all’,输出列集将和输入相匹配
pandas.DataFrame.describe 官方文档翻译percentile_width,percentiles,include, exclude
标签:统计信息 推荐 numpy color 参考 cat 选择 str strong
原文地址:http://www.cnblogs.com/yezhaodan/p/7457825.html