码迷,mamicode.com
首页 >  
搜索关键字:dataframe    ( 1310个结果
知识点-Spark小节
Spark处理字符串日期的max和min的方式 Spark处理数据存储到Hive的方式 Spark处理新增列的方式map和udf、functions Spark处理行转列pivot的使用 ...
分类:其他好文   时间:2017-12-03 15:35:46    阅读次数:231
Python入门5(pandas中merge中的参数how)
1 import pandas as pd 2 df1 = pd.DataFrame([[1,2,3],[5,6,7],[3,9,0],[8,0,3]],columns=['x1','x2','x3']) 3 df2 = pd.DataFrame([[1,2],[4,6],[3,9]],column ...
分类:编程语言   时间:2017-12-01 16:40:39    阅读次数:431
pandas.read_csv参数整理
读取CSV(逗号分隔)文件到DataFrame,也支持文件的部分导入和选择迭代 更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html 参数: filepath_or_buffer:str,pathlib。str,pathlib.Path ...
分类:其他好文   时间:2017-11-30 17:24:13    阅读次数:234
spark提示Caused by: java.lang.ClassCastException: scala.collection.mutable.WrappedArray$ofRef cannot be cast to [Lscala.collection.immutable.Map;
spark提示Caused by: java.lang.ClassCastException: scala.collection.mutable.WrappedArray$ofRef cannot be cast to [Lscala.collection.immutable.Map; 起因 编写了 ...
分类:移动开发   时间:2017-11-28 12:44:07    阅读次数:355
量化框架zipline--分钟回测改写
转自:http://www.cnblogs.com/dxf813/p/7845398.html 基于zipline的分钟回测改写,其中数据源为自定义,使用bcolz的ctable,该数据格式与pandas的DataFrame很好兼容,并且bcolz文件压缩率很好。以下主要记录此次改写回测整个过程中涉 ...
分类:其他好文   时间:2017-11-27 11:07:00    阅读次数:898
DataFrame修改列名
转自:https://www.cnblogs.com/hhh5460/p/5816774.html 问题:有一个DataFrame,列名为:['$a', '$b', '$c', '$d', '$e']现需要改为:['a', 'b', 'c', 'd', 'e']有何办法? 解决: 方式一:colum ...
分类:其他好文   时间:2017-11-26 14:54:09    阅读次数:364
[读书笔记] R语言实战 (四) 基本数据管理
1. 创建新的变量 2. 变量的重编码 连续->类别 错误->正确值 分数->级别划分 3. 变量的重命名 reshape()包中的rename()函数 rename(dataframe, c(oldname='newname',oldname = 'newname') 4. 缺失值 缺失值:NA( ...
分类:编程语言   时间:2017-11-22 13:09:15    阅读次数:154
pandas DataFrame 警告(SettingWithCopyWarning)
刚接触python不久,编程也是三脚猫,所以对常用的这几个工具还没有一个好的使用习惯,毕竟程序语言是头顺毛驴。所以最近在工作中使用的时候在使用pandas的DataFrame时遇到了以下报警: SettingWithCopyWarning: A value is trying to be set o ...
分类:其他好文   时间:2017-11-21 23:55:46    阅读次数:177
使用dataframe解决spark TopN问题:分组、排序、取TopN
package com.profile.mainimport org.apache.spark.sql.expressions.Windowimport org.apache.spark.sql.functions._import com.profile.tools.{DateTools, Jdbc ...
分类:编程语言   时间:2017-11-21 17:40:44    阅读次数:288
Pandas的函数应用、层级索引、统计计算
1.Pandas的函数应用 1.apply 和 applymap 1. 可直接使用NumPy的函数 示例代码: # Numpy ufunc 函数 df = pd.DataFrame(np.random.randn(5,4) - 1) print(df) print(np.abs(df)) 运行结果: ...
分类:其他好文   时间:2017-11-19 19:44:58    阅读次数:234
1310条   上一页 1 ... 97 98 99 100 101 ... 131 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!