标签:取数据 文件名 htm shift series 遍历 读取 保存文件 改变
pandas:是一个数据分析的类库
dataframe数据读入
read_json
html
csv
excel
sql
数据写出 to_json
html
csv
excel
sql
数据结构
第一个 series :是一个一维的ndarray , 带有标签 可以通过标签作为索引
尺度不能改变,里面的数据可以改变
series
import pandas as pd
s=pd.Series([1,2,3,45],index=[‘a‘,‘b‘,‘c‘,‘d‘,‘e‘])
print(s[2])
print(s[‘c‘])
可以通过标签获取数据,也可以通过索引下标来获取(前提需要导入包)
第二个 dataframe :是一个二维的ndarray ,带有标签(行 ,列) 可以通过行列标签索引,
尺度可变,数据可变
创建csv文件,esc shift +zz 保存
查看文件 cat +文件名
在pandas里读取 df = pd.read_csv(‘students.csv‘)
df.head() #显示数据
a = df[["name","score"]] #取得名称和分数 sclect
a.head()
b = df[df["sex"] == ‘男‘] #取得男生信息 where
b.head()
c = df.iloc[:3] limit # loc 以标签索引 显示三条数据 iloc 以下标索引 显示四条数据
c.head()
遍历只能得到列 得不到元素
for c in df: df.iteritems(): #得到元素
print(c)
name
age
sex
score
数据访问和变换,统计
select
where
limit
loc 以标签索引
iloc 以下标索引
数据展示
保存文件 单独保存付费的文件
import pandas as pd
df = pd.read_csv("kgc.csv")
df1 = df[df[‘price‘]!=‘免费‘]
df1.to_csv(‘付费.csv‘,encoding=‘utf-8‘)
标签:取数据 文件名 htm shift series 遍历 读取 保存文件 改变
原文地址:https://www.cnblogs.com/yuello/p/9257831.html