1、Pandas模块DataFrame提供的是一个类似表的结构,由多个Series组成,而Series在DataFrame中columns。2、安装IPython解释器:其实,一键安装Anaconda可以帮助使用者,一次性配置好我所有需要的工具包以及IPython解释器环境。但是,出于我想学习更加透彻,所以自己安装工具包和..
分类:
系统相关 时间:
2017-03-30 14:16:59
阅读次数:
229
List:listA = ['python','python','言','是','一','门','动','态','语','言']print sorted(set(listA), key = listA.index)DataFrame: gd = gd.query('mbrg > @grouth an... ...
分类:
编程语言 时间:
2017-03-26 23:31:52
阅读次数:
208
需求:统计每月每台打印机的打印量,打印量已生成CSV文件报告,可直接对该文件分析即可。思路:主要用到Python的pandas模块,先分类汇总后再求和#conding:utf-8importcsvfrompandasimportSeries,DataFrameimportpandasaspddata=pd.read_csv("./p2.csv")df=DataFrame(data)group..
分类:
编程语言 时间:
2017-03-22 23:45:30
阅读次数:
303
Merge, join, and concatenate pandas provides various facilities for easily combining together Series, DataFrame, and Panel objects with various kinds ...
分类:
其他好文 时间:
2017-03-19 15:54:54
阅读次数:
571
PyOdps 0.4版本,DataFrame API支持使用pandas进行本地计算,用户因此能join ODPS和本地数据,也能进行本地debug,另外还有MapReduce API等新特性 ...
分类:
其他好文 时间:
2017-03-17 19:33:44
阅读次数:
332
PyOdps正式发布DataFrame框架(此处应掌声经久不息),DTer的福音!有了它,就像卷福有了花生,比翼双飞,哦不,如虎添翼。 快过年了,大家一定没心情看长篇大论的分析文章。作为介绍PyOdps DataFrame的开篇文章,我只说说其用起来爽的地方。其余的部分,从使用、问题到实现原理,我 ...
分类:
其他好文 时间:
2017-03-17 19:29:00
阅读次数:
652
PyODPS,拥有对于Python用户传统的数据分析和机器学习愉快的体验,包括了DataFrame框架和机器学习模块,它们类似于pandas+scikit-learn,能用它们进行数据分析、绘图、机器学习等等。 ...
分类:
其他好文 时间:
2017-03-17 17:36:29
阅读次数:
232
pandas中DataFrame,Series 都有 isnull()方法,而数据框却没有,用了就会报错:AttributeError: 'float' object has no attribute 'isnull' 怎么判断单个框是否为 np.nan Python常规的判断,==,和is, 这对 ...
分类:
编程语言 时间:
2017-03-15 11:56:24
阅读次数:
13688
dataframe可以实现很多操作,但是存储到本地的时候,只能存parquest格式需要存储源格式,需要转换为rdd类型将dataframe中的每一行都map成有逗号相连的string,就变为了一个rdd
分类:
其他好文 时间:
2017-03-14 21:21:21
阅读次数:
159
dycopy :http://blog.csdn.net/dabokele/article/details/52802150 Spark SQL中的DataFrame类似于一张关系型数据表。在关系型数据库中对单表或进行的查询操作,在DataFrame中都可以通过调用其API接口来实现。可以参考,Sc ...
分类:
数据库 时间:
2017-03-13 11:33:07
阅读次数:
506