Pandas的应用

时间：2018-07-03 14:59:29 阅读：154 评论：0 收藏：0 [点我收藏+]

pandas:是一个数据分析的类库

dataframe数据读入
read_json
html
csv
excel
sql
数据写出 to_json
html
csv
excel
sql

数据结构

第一个 series ：是一个一维的ndarray ，带有标签可以通过标签作为索引
尺度不能改变，里面的数据可以改变
series
import pandas as pd
s=pd.Series([1,2,3,45],index=[‘a‘,‘b‘,‘c‘,‘d‘,‘e‘])
print(s[2])
print(s[‘c‘])
可以通过标签获取数据，也可以通过索引下标来获取（前提需要导入包）

第二个 dataframe ：是一个二维的ndarray ，带有标签（行，列）可以通过行列标签索引，
尺度可变，数据可变
创建csv文件，esc shift +zz 保存
查看文件 cat +文件名
在pandas里读取 df = pd.read_csv(‘students.csv‘)
df.head() #显示数据

a = df[["name","score"]] #取得名称和分数 sclect
a.head()

b = df[df["sex"] == ‘男‘] #取得男生信息 where
b.head()

c = df.iloc[:3] limit # loc 以标签索引显示三条数据 iloc 以下标索引显示四条数据
c.head()

遍历只能得到列得不到元素
for c in df: df.iteritems(): #得到元素
print(c)
name
age
sex
score

数据访问和变换，统计
select
where
limit
loc 以标签索引
iloc 以下标索引

数据展示

保存文件单独保存付费的文件
import pandas as pd

df = pd.read_csv("kgc.csv")
df1 = df[df[‘price‘]!=‘免费‘]
df1.to_csv(‘付费.csv‘,encoding=‘utf-8‘)

Pandas的应用

标签：取数据文件名 htm shift series 遍历读取保存文件改变

原文地址：https://www.cnblogs.com/yuello/p/9257831.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行