码迷,mamicode.com
首页 > 其他好文 > 详细

Pandas-数据探索

时间:2016-10-11 11:23:03      阅读:162      评论:0      收藏:0      [点我收藏+]

标签:

Pandas包对数据的常用探索功能,方便了解数据描述性属性。

Pandas数据格式

  • Series
  • DataFrame:每个column就是一个Series

基础属性

  • shape
    • 返回行列数
  • index
  • columns
  • values
  • dtype/dtypes

 

基础方法

  • unique()
    • 返回唯一值的数组
  • isnull()
    • notnull():isnull()的否定式
    • df.isnull()
      s.isnull() s.isnull().value_counts()
  • isin()
    • 1 # 返回布尔值
      2 s.isin([1,2,3])
      3 df["A"].isin([1,2,3])

       

统计方法

  • count()
  • value_counts()
    • 统计Series各值数量  
    • # 默认 sort = True
      s.value_counts()
      pd.value_counts(s,sort=False)
  • describe() 
    • df.describe()
       
       ABCD
      count 6.000000 6.000000 6.000000 6.000000
      mean -0.465925 -0.146798 0.005445 -0.756245
      std 0.841877 0.238644 1.389317 1.471563
      min -1.587605 -0.456638 -2.072448 -2.840490
      25% -0.786075 -0.306717 -0.649605 -1.528442
      50% -0.729990 -0.144521 -0.021415 -0.816773
      75% 0.090604 0.035111 0.848559 0.157414
      max 0.692672 0.130688 1.868398 1.220088

Pandas-数据探索

标签:

原文地址:http://www.cnblogs.com/stream886/p/5948212.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!