1,pd.concat:拼接1.1,axisdf1 = pd.DataFrame(np.ones((3,4))*0, columns = ['a', 'b', 'c', 'd'])df2 = pd.DataFrame(np.ones((3,4))*1, columns = ['a', 'b', 'c ...
分类:
移动开发 时间:
2018-08-09 21:19:56
阅读次数:
207
.dataframe tbody tr th:only of type { vertical align: middle; } .dataframe tbody tr th { vertical align: top; } .dataframe thead th { text align: righ ...
分类:
其他好文 时间:
2018-08-09 00:33:18
阅读次数:
927
1. Series Series 是一个类数组的数据结构,同时带有标签(lable)或者说索引(index)。 1.1 下边生成一个最简单的Series对象,因为没有给Series指定索引,所以此时会使用默认索引(从0到N-1)。 1.2 当要生成一个指定索引的Series 时候,可以这样: 1.3 ...
分类:
编程语言 时间:
2018-08-06 14:37:38
阅读次数:
230
本文翻译自文章: Pandas Cheat Sheet - Python for Data Science ,同时添加了部分注解。 对于数据科学家,无论是数据分析还是数据挖掘来说,Pandas是一个非常重要的Python包。它不仅提供了很多方法,使得数据处理非常简单,同时在数据处理速度上也做了很多优 ...
分类:
其他好文 时间:
2018-08-05 19:40:07
阅读次数:
207
df = pd.DataFrame(np.arange(16).reshape(4, 4), columns=list('abcd'), index=['1', '2', '3', '4'])print(df) a b c d1 0 1 2 32 4 5 6 73 8 9 10 114 12 13 ...
分类:
其他好文 时间:
2018-08-05 00:38:05
阅读次数:
1714
数据转换 删除重复元素 DataFrame对象的duplicated()函数可用来检测重复的行,返回元素为布尔型的Series对象。 每个元素对 应一行,如果该行与其他行重复(也就是说该行不是第一次出现),则元素为True; 如果跟前面不重复,则元 素就为False。 返回元素为布尔值的Series ...
分类:
编程语言 时间:
2018-08-03 14:56:35
阅读次数:
225
关键缩写和包导入 在这个速查手册中,我们使用如下缩写: df:任意的Pandas DataFrame对象 同时我们需要做如下的引入: import pandas as pd 导入数据 pd.read_csv(filename):从CSV文件导入数据pd.read_table(filename):从限 ...
分类:
其他好文 时间:
2018-08-02 16:07:25
阅读次数:
206
准备工作 倒入文件或创建一个数据表 df = pd.DataFrame(pd.read_csv('name.csv',header=1)) df = pd.DataFrame(pd.read_excel('name.xlsx')) pd.read_table(filename)# 从限定分隔符的文本 ...
分类:
其他好文 时间:
2018-08-01 16:07:37
阅读次数:
319
DataFrame的定义 使用index参数可以设置index信息 选取元素 一般我们常需要按列取值,那么DataFrame提供了 loc 和 iloc 供大家选择,但是两者之间是由区别的。 一般取值操作 ...
分类:
编程语言 时间:
2018-07-31 11:48:26
阅读次数:
131
df = pd.DataFrame(np.arange(12).reshape(3, 4)) df Out[10]: 0 1 2 3 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11 df.as_matrix() Out[11]: array([[ 0, 1, 2, 3], [ 4, ... ...
分类:
其他好文 时间:
2018-07-31 10:59:19
阅读次数:
2589