DataFrame的这些操作和Series很相似,这里简单介绍一下。 一,应用 apply()函数应用于轴级别,applymap应用于元素级别: 定义一个函数fun,使用apply()函数把fun应用到由DataFrame对象的列构成的一维数组上,通常fun函数是由聚合函数构成的。 定义一个函数fo ...
分类:
其他好文 时间:
2019-10-08 14:28:46
阅读次数:
169
数据处理的目的是为了数据分析,下面分享常用的数据分析中会用到的函数。 一,分组和聚合 groupby用于对数据分组,分组之后可以直接调用聚合函数求值;agg()函数把分组和调用聚合函数集成到一个函数来实现: 二,窗口 rolling()是指按照窗口滚动求值,expanding()是指依次递增1,计算 ...
分类:
其他好文 时间:
2019-10-08 14:12:12
阅读次数:
848
import pandas as pdimport numpy as np# x = pd.DataFrame([[2000,0.732,0.836,0.628,0.743], [2001,0.758,0.883,0.688,0.787], [2002,0.859,0.914,0.781,0.929 ...
分类:
编程语言 时间:
2019-10-07 19:48:27
阅读次数:
1025
8. Dataset (DataFrame) 的基础操作 8.1. 有类型操作 8.2. 无类型转换 8.5. Column 对象 9. 缺失值处理 10. 聚合 11. 连接 8.1. 有类型操作 8.2. 无类型转换 8.5. Column 对象 8. Dataset (DataFrame) 的 ...
分类:
数据库 时间:
2019-10-06 00:19:23
阅读次数:
116
pandas入门之DataFrame 创建DataFrame - DataFrame是一个【表格型】的数据结构。DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series的使用场景从一维拓展到多维。DataFrame既有行索引,也有列索引。 - 创建DataFrame的方式 - 列表 ...
分类:
其他好文 时间:
2019-10-05 14:49:35
阅读次数:
95
Spark SQL是处理结构化的数据,可以存储在二维表中,类似数据库中的表一样存储数据 Spark1.x val sqlContext = new SparkContext(conf) val sqlContext = new SQLContext(sc) //将RDD和Schema信息关联到一起, ...
分类:
数据库 时间:
2019-10-04 11:28:54
阅读次数:
107
import pandas as pddf1=pd.DataFrame({'key':['a','b','c'],'data1':range(3)})df2=pd.DataFrame({'key':['a','b','d'],'data2':range(3)})pd.merge(df1,df2) # ...
分类:
其他好文 时间:
2019-10-03 22:14:48
阅读次数:
109
前言: 由于在处理结构性数据的时候经常会读取本地形如:.xls、xlsx、csv等的数据。所以今天就花了点时间来总结一下利用python读取csv数据并且转换为dataframe的数据框架。话不多说,直接附代码: ...
分类:
编程语言 时间:
2019-10-03 16:32:26
阅读次数:
249
使用散点图矩阵图,可以两两发现特征之间的联系 1、frame,pandas dataframe对象2、alpha, 图像透明度,一般取(0,1]3、figsize,以英寸为单位的图像大小,一般以元组 (width, height) 形式设置4、ax,可选一般为none5、diagonal,必须且只能 ...
分类:
其他好文 时间:
2019-10-01 20:36:53
阅读次数:
159
1 diff()是将原来的数据减去移动后的数据. 在numpy和pandas中都能调用. pandas的调用方法: import pandas as pd df = pd.DataFrame( {'a':[1,2,3,4,5], 'b':[6,7,8,9,10], 'c':[11,12,13,14, ...
分类:
其他好文 时间:
2019-09-30 23:57:15
阅读次数:
1101