码迷,mamicode.com
首页 >  
搜索关键字:dataframe    ( 1310个结果
pandas 学习 第10篇:DataFrame 数据处理(应用、追加、截断、连接、合并、重复值、重索引、重命名、重置索引、设置轴索引、选择和过滤)
DataFrame的这些操作和Series很相似,这里简单介绍一下。 一,应用 apply()函数应用于轴级别,applymap应用于元素级别: 定义一个函数fun,使用apply()函数把fun应用到由DataFrame对象的列构成的一维数组上,通常fun函数是由聚合函数构成的。 定义一个函数fo ...
分类:其他好文   时间:2019-10-08 14:28:46    阅读次数:169
pandas 学习 第11篇:DataFrame-数据处理(分组、聚合、窗口、相关、统计)
数据处理的目的是为了数据分析,下面分享常用的数据分析中会用到的函数。 一,分组和聚合 groupby用于对数据分组,分组之后可以直接调用聚合函数求值;agg()函数把分组和调用聚合函数集成到一个函数来实现: 二,窗口 rolling()是指按照窗口滚动求值,expanding()是指依次递增1,计算 ...
分类:其他好文   时间:2019-10-08 14:12:12    阅读次数:848
灰色关联分析法步骤(python代码实现)
import pandas as pdimport numpy as np# x = pd.DataFrame([[2000,0.732,0.836,0.628,0.743], [2001,0.758,0.883,0.688,0.787], [2002,0.859,0.914,0.781,0.929 ...
分类:编程语言   时间:2019-10-07 19:48:27    阅读次数:1025
Update:sparksql:第3节 Dataset (DataFrame) 的基础操作 & 第4节 SparkSQL_聚合操作_连接操作
8. Dataset (DataFrame) 的基础操作 8.1. 有类型操作 8.2. 无类型转换 8.5. Column 对象 9. 缺失值处理 10. 聚合 11. 连接 8.1. 有类型操作 8.2. 无类型转换 8.5. Column 对象 8. Dataset (DataFrame) 的 ...
分类:数据库   时间:2019-10-06 00:19:23    阅读次数:116
pandas之DataFrame
pandas入门之DataFrame 创建DataFrame - DataFrame是一个【表格型】的数据结构。DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series的使用场景从一维拓展到多维。DataFrame既有行索引,也有列索引。 - 创建DataFrame的方式 - 列表 ...
分类:其他好文   时间:2019-10-05 14:49:35    阅读次数:95
Spark SQL是处理结构化的数据
Spark SQL是处理结构化的数据,可以存储在二维表中,类似数据库中的表一样存储数据 Spark1.x val sqlContext = new SparkContext(conf) val sqlContext = new SQLContext(sc) //将RDD和Schema信息关联到一起, ...
分类:数据库   时间:2019-10-04 11:28:54    阅读次数:107
数据集的合并
import pandas as pddf1=pd.DataFrame({'key':['a','b','c'],'data1':range(3)})df2=pd.DataFrame({'key':['a','b','d'],'data2':range(3)})pd.merge(df1,df2) # ...
分类:其他好文   时间:2019-10-03 22:14:48    阅读次数:109
python读取csv转换为dataframe
前言: 由于在处理结构性数据的时候经常会读取本地形如:.xls、xlsx、csv等的数据。所以今天就花了点时间来总结一下利用python读取csv数据并且转换为dataframe的数据框架。话不多说,直接附代码: ...
分类:编程语言   时间:2019-10-03 16:32:26    阅读次数:249
pandas库scatter_matrix绘图可视化参数详解
使用散点图矩阵图,可以两两发现特征之间的联系 1、frame,pandas dataframe对象2、alpha, 图像透明度,一般取(0,1]3、figsize,以英寸为单位的图像大小,一般以元组 (width, height) 形式设置4、ax,可选一般为none5、diagonal,必须且只能 ...
分类:其他好文   时间:2019-10-01 20:36:53    阅读次数:159
diff()函数
1 diff()是将原来的数据减去移动后的数据. 在numpy和pandas中都能调用. pandas的调用方法: import pandas as pd df = pd.DataFrame( {'a':[1,2,3,4,5], 'b':[6,7,8,9,10], 'c':[11,12,13,14, ...
分类:其他好文   时间:2019-09-30 23:57:15    阅读次数:1101
1310条   上一页 1 ... 39 40 41 42 43 ... 131 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!