三大对象 1.DataFrame(index, columns ,values) 1)先从文件(excel,csv,mysql)中读取,或者自己制造一个DataFrame对象 2)查看数据 查看数据的形状(几行几列) 查看每一列的数据类型,数据中是否有空值(行、列),查看每一列和标签的关系(离散-柱 ...
分类:
其他好文 时间:
2019-07-16 10:47:49
阅读次数:
86
dplyr包可用于处理 R 内部或者外部的结构化数据,相较于plyr包,dplyr包专注接受 data.frame 对象,大幅提高了速度,并且提供了更稳健的数据库接口。同时,dplyr包可用于操作Spark的dataframe。 安装dplyr包 install.packages("dplyr") ...
分类:
其他好文 时间:
2019-07-15 14:50:14
阅读次数:
94
方法1:利用pandas自带的read_json直接解析字符串 方法2:利用json的loads和pandas的json_normalize进行解析 方法3:利用json的loads和pandas的DataFrame直接构造(这个过程需要手动修改loads得到的字典格式) ...
分类:
Web程序 时间:
2019-07-14 18:13:46
阅读次数:
204
import pandas as pdimport numpy as npfrom pandas import Series,DataFrame#重命名DataFrame的indexdf1 = DataFrame(np.arange(9).reshape(3,3),index=["BJ","SH", ...
分类:
编程语言 时间:
2019-07-04 11:24:14
阅读次数:
106
import pandas as pdimport numpy as npfrom pandas import Series,DataFrame#时间序列的操作基础from datetime import datetime"""t = datetime(2016,9,10)print(t)#2016 ...
分类:
编程语言 时间:
2019-07-04 11:20:29
阅读次数:
91
#NaN --means Not a Numberimport pandas as pdimport numpy as npfrom pandas import Series,DataFrame# n = np.nan# print(type(n)) #<class 'float'># print( ...
分类:
编程语言 时间:
2019-07-04 11:07:02
阅读次数:
147
import pandas as pdimport numpy as npfrom pandas import Series,DataFrame"""df = pd.read_excel("sales-funnel.xlsx")#print(df)# Account Name ... Price S ...
分类:
编程语言 时间:
2019-07-04 11:05:16
阅读次数:
219
# 1 删除重复元素 2 映射 replace 代替 s = Series(data=[3,4,5,6,7,8]) s.replace(3,'s') #新数据 原数据不变 s.replace([4,5],['sx','zc']) #多值替换 replace参数说明: method:对指定的值使用相邻 ...
分类:
其他好文 时间:
2019-07-03 00:29:39
阅读次数:
112
引用库文件 加载数据集,生成数据帧资源句柄 将pandas dataframe 数据格式转变为 tf.data 格式的数据集形式 ds 中有shuffle、batch、repeat三个方法;具体区别如下 shuffle: tensorflow中的数据集类Dataset有一个shuffle方法,用来打 ...
分类:
其他好文 时间:
2019-06-29 19:13:58
阅读次数:
1199
问题来源 在实验中经常需要将数据保存到易于查看的文件当中,由于大部分都是vector数据,所以选择pandas的dataframe来保存到csv文件是最简单的方法。 基本操作 下图是DataFrame的一些基本概念,可以看出与基本的csv结构是保持一致的。 1. 创建DataFrame 创建Data ...
分类:
编程语言 时间:
2019-06-26 19:30:38
阅读次数:
147