之前介绍了numpy的二维数组,但是numpy二维数组有一些局限性,比如,它数组里所有的值的类型必须相同,不能某一列是数值型,某一列是字符串型,这样会导致无法使用 mean() , std() 等方法去计算某一行或某一列. 但是,使用pandas DataFrame可以解决这一问题. pandas ...
分类:
其他好文 时间:
2018-06-29 01:14:37
阅读次数:
146
cs229学习问题 notes3 Support Vector Machines 18、上面写法(注释掉的)和下面写法区别是什么?应该采用哪个更好? 17、为什么下面两行代码结果不一致?会不会是DataFrame的一个bug,分母多除了,本来应该除以2,错误地除以4了。 16、机器学习模型太多了,( ...
分类:
其他好文 时间:
2018-06-28 19:28:56
阅读次数:
274
Pandas主要有4中与时间相关的类型。Timestamp, Period, DatetimeIndex,PeriodIndex. 1. 关于时间类型的转换 2. 时间间隔 3. Dataframe中的时间 ...
分类:
编程语言 时间:
2018-06-26 23:05:14
阅读次数:
311
# 创建空DataFrame df = pd.DataFrame(columns = ['YJML','EJML','SJML','WZLB','GGXHPZ','CGMS']) # 插入数据(忽略索引) df = df.append(kjcgml.loc[i].append(bzwzcgml.lo ...
分类:
编程语言 时间:
2018-06-26 18:05:13
阅读次数:
2076
说明:withColumn用于在原有DF新增一列 1. 初始化sqlContext val sqlContext = new org.apache.spark.sql.SQLContext(sc) 2.导入sqlContext隐式转换 import sqlContext.implicits._ 3. ...
分类:
其他好文 时间:
2018-06-25 20:32:01
阅读次数:
6643
import tushare as ts import pandas as pd import numpy as np import sqlite3 pf=ts.get_hist_data('600848') con=sqlite3.connect('c:\\desktop\\stockdata.d ...
分类:
数据库 时间:
2018-06-24 23:57:20
阅读次数:
2665
创建空dataframe 1,data=pd.DataFrame() 2,data=pd.DataFrame(columns=['a','b','c','d']) 删除列 data.drop('a',axis=1) 删除行 data.drop([0,1]) #按索引删除 ...
分类:
其他好文 时间:
2018-06-24 16:55:49
阅读次数:
164
首先安装完numpy之后就可以安装pandas了 pip insert pandas 下面是简单的用法可读取任何文件数据包括数据库 import pandas as pd #通常用pd作为pandas的别名s=pd.Series([1,2,3],index=['a','b','c'])#创建一个序列 ...
分类:
其他好文 时间:
2018-06-23 17:05:42
阅读次数:
167
#求两个list差集、交集和并集 http://www.jb51.net/article/56980.htm a = [1,2,3]; b = [2,3,4] #想要的结果是[1] [4] [2,3] [1,2,3,4] aa=[i for i in a if i not in b] #[1] bb ...
分类:
编程语言 时间:
2018-06-21 18:27:28
阅读次数:
160
一、pandas简单介绍 1、pandas是一个强大的Python数据分析的工具包。2、pandas是基于NumPy构建的。3、pandas的主要功能 --具备对其功能的数据结构DataFrame、Series --集成时间序列功能 --提供丰富的数学运算和操作 --灵活处理缺失数据4、安装方法:p ...
分类:
编程语言 时间:
2018-06-21 01:38:16
阅读次数:
802