码迷,mamicode.com
首页 > 其他好文 > 详细

数据蛙提高-pandas学习

时间:2020-02-06 13:05:34      阅读:85      评论:0      收藏:0      [点我收藏+]

标签:dataframe   base   提高   round   name   选择   第一个   als   标签   

read_csv

??不同参数的作用

  • header默认为0,即第一行为表头,如果header=None,则0开始的数字作为表头,可以配合name=[]定义表头。

 

Series和DataFrame数据结构

to_frame(name=None)方法,把Series格式数据转化为DataFrame格式。

 

索引

使用索引我们就可以对数据进行选取和筛选

  1. 使用位置做索引
  2. 使用列表做索引
  3. 使用切片做索引
  4. 使用bool类型索引

loc方法

``.loc[]`` is primarily label based, but may also be used with a boolean array. 主要是基于标签,也可以使用布林数组。

  • 内部参数可以使用单一的标签如1或"a"
  • 一个list或array作为标签,如[‘a‘, ‘b‘, ‘c‘]
  • 或切片‘a‘:‘f‘`,??这是双闭合的, 
  • 一个布林数组
  • 一个带单一参数(Series,或DataFrame)的可调用函数并返回验证后的输出结果作为索引。

例子:

df.loc[df["年龄"]>40]

 

行列的形式:第一个参数是选行,第二个参数选择列

df.loc[[1,2,3], [年龄, "性别"]]

??第二个参数不能使用整数切片或整数行数。

?df.loc[0:3, [0,1,2]]
?df.loc[0:3, 0:2]

 

 

 

iloc方法

``.iloc[]`` is primarily integer position based (from ``0`` to ``length-1`` of the axis), but may also be used with a boolean array.

基于整数位置的,默认0代表第一行或第一列。iloc的字母i就代表integer

可以输入的参数是:

  •  一个整数
  • 一个list,或整数型的array, 如[4, 5]
  • 整数切片, ??左闭合,右开放。
  • 一个布林数组
  • 一个带单一参数(Series,或DataFrame)的可调用函数并返回验证后的输出结果作为索引。

行列的形式:第一个参数是选行,第二个参数选择列。

df.iloc[0:3, 0:2]
等同于
df.iloc[0:3, [0,1,2]]

 

 ??只能用整数。不能使用具体的列名字。

 

数据蛙提高-pandas学习

标签:dataframe   base   提高   round   name   选择   第一个   als   标签   

原文地址:https://www.cnblogs.com/chentianwei/p/12267929.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!