机器学习代码基础（4）-- Pandas速成

时间：2020-01-19 12:48:31 阅读：79 评论：0 收藏：0 [点我收藏+]

标签：port 表格 myarray csv文件 code head order 面向 OWIN

1.4 Pandas速成

Pandas是面向数据分析场景设计的Python开源软件工具包，从命名来看，Pandas特别适合处理序列数据、表格数据等具有良好结构的数据。通过带有标签的列和索引，Pandas使我们可以以一种便于理解的方式来处理数据。它可以让我们毫不费力地从诸如csv类型的文件中导入数据。

Series：一维数组

DataFrame：二维数组

1.4.1Series

Series与numpy中的一维数组类似，但是再建立Series时可以设定index，也可以像访问numpy数组或字典一样访问Series对象。

import numpy as np
import pandas as pd
myarray = np.array([1,2,3])
index = [‘a‘,‘b‘,‘c‘]
myseries = pd.Series(myarray,index=index)
print(myseries)
print(myseries[0])
print(myseries[‘c‘])

1.4.2DataFrame

DataFrame是一个可以指定行和列标签的二维数组，可以通过指定列名来访问特定列的数据。

import numpy as np
import pandas as pd
myarray = np.array([[1,2,3],[2,3,4],[3,4,5]])
rowindex = [‘row1‘,‘row2‘,‘row3‘]
colname = [‘col‘,‘col2‘,‘col3‘]
mydataframe = pd.DataFrame(myarray,index=rowindex,columns=colname)
print(mydataframe)
print(mydataframe[‘col3‘])

1.4.3读取csv文件

使用Pandas导入数据比Numpy要容易

import pandas as pd
names = [‘a‘,‘b‘,‘c‘,‘d‘,‘e‘]
df = pd.read_csv(‘iris.csv‘,names = names,header = None)
df.head(5)
df.tail(5)
df.values

机器学习代码基础（4）-- Pandas速成

标签：port 表格 myarray csv文件 code head order 面向 OWIN

原文地址：https://www.cnblogs.com/lsm-boke/p/12212967.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行