码迷,mamicode.com
首页 > 其他好文 > 详细

pandas模块

时间:2019-08-24 11:26:35      阅读:92      评论:0      收藏:0      [点我收藏+]

标签:文本   分组聚合   json   布尔   pandas   lis   文件   html   绘图   

pandas模块

pandas官方文档:https://pandas.pydata.org/pandas-docs/stable/?v=20190307135750

pandas基于Numpy,可以看成是处理文本或者表格数据。pandas中有两个主要的数据结构,其中Series数据结构类似于Numpy中的一维数组,DataFrame类似于多维表格数据结构。

pandas是python数据分析的核心模块。它主要提供了五大功能:

  1. 支持文件存取操作,支持数据库(sql)、html、json、pickle、csv(txt、excel)、sas、stata、hdf等。
  2. 支持增删改查、切片、高阶函数、分组聚合等单表操作,以及和dict、list的互相转换。
  3. 支持多表拼接合并操作。
  4. 支持简单的绘图操作。
  5. 支持简单的统计分析操作。

一、Series数据结构

Series是一种类似于一维数组的对象,由一组数据和一组与之相关的数据标签(索引)组成。

Series比较像列表(数组)和字典的结合体

import numpy as np
import pandas as pd
df = pd.Series(0, index=['a', 'b', 'c', 'd'])
print(df)

a 0
b 0
c 0
d 0
dtype: int64

print(df.values)
print(df.index)

[0 0 0 0]

ndex([‘a‘, ‘b‘, ‘c‘, ‘d‘], dtype=‘object‘)

1.1Series支持NumPy模块的特性(下标)

详解 方法
从ndarray创建Series Series(arr)
与标量运算 df*2
两个Series运算 df1+df2
索引 df[0], df[[1,2,4]]
切片 df[0:2]
通用函数 np.abs(df)
布尔值过滤 df[df>0]

pandas模块

标签:文本   分组聚合   json   布尔   pandas   lis   文件   html   绘图   

原文地址:https://www.cnblogs.com/dadazunzhe/p/11403984.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!