从这里找的一个宝贝源码,可以大大缓解内存问题。https://www.kaggle.com/arjanso/reducing dataframe memory size by 65/code ...
分类:
其他好文 时间:
2020-03-06 23:40:50
阅读次数:
117
pandas的索引操作可以快速的完成多种功能。 import pandas as pd import numpy as np 1. 首先pandas创建DataFrame df_1 = pd.DataFrame([['Jack','M',40],['Tony','M',20],['Mary','F' ...
分类:
其他好文 时间:
2020-03-04 21:18:51
阅读次数:
71
数据处理框架 数据处理是一个非常宽泛的概念,数据处理框架在数据架构中,主要是用于数据移动和分析这两大功能当中.对于数据移动,有离线数据移动和实时数据移动,也可以叫做是批量数据移动和流式数据移动.而对于分析这一块,有离线数据分析和实时数据分析,也可以称作是批量数据分析和流式数据分析.离线和实时,批量和 ...
分类:
其他好文 时间:
2020-03-03 11:24:43
阅读次数:
95
from pandas import DataFrame import numpy as np import pandas as pd t={ "age": [18, 30, np.nan, 40, np.nan, 30], "city": ["BeiJing", "ShangHai", "Guan ...
分类:
其他好文 时间:
2020-03-03 10:33:02
阅读次数:
80
Python——DataFrame基础操作 DataFrame理解 DataFrame可以看做是有序排列的若干Series对象,这里的“排列”是指这些Series都有共同的索引。 一、读取文件 dt = pd.read_csv(path) dt = pd.read_excel(path) dt = ...
分类:
编程语言 时间:
2020-03-01 12:36:12
阅读次数:
75
1.代码1: from pandas import Series,DataFrame from numpy.random import randn import numpy as np import matplotlib.pyplot as plt #随机产生的数值,5组10行,每次打开图形都会变, ...
分类:
编程语言 时间:
2020-02-28 15:59:30
阅读次数:
77
一、rename,更改df的列名和行索引 1 df=pd.DataFrame(np.arange(1,10).reshape(3,3)) 2 print(df) 3 print(type(df)) 4 结果为: 5 0 1 2 6 0 1 2 3 7 1 4 5 6 8 2 7 8 9 9 <cla ...
分类:
编程语言 时间:
2020-02-28 12:09:02
阅读次数:
107
最开始是将数据库数据写到本地excel中,再读出来返回给前端,后面发现可以使用BytesIO(),不用再使用本地文件 x_io = BytesIO() df = pd.DataFrame(list(res['data'])) df.to_excel(x_io, sheet_name=table_na ...
分类:
其他好文 时间:
2020-02-25 20:32:19
阅读次数:
170
Pandas是为了解决数据分析任务而创建的,纳入了大量的库和标准数据模型,提供了高效地操作大型数据集所需的工具。 对于Pandas包,在Python中常见的导入方法如下: from pandas import Series,DataFrame import pandas as pd 首先,我们需要对 ...
分类:
其他好文 时间:
2020-02-23 22:02:23
阅读次数:
140
[TOC] 下面继续讲解pandas的第二个工具DataFrame。 二:pandas数据结构介绍 2.DataFarme DataFarme表示的是矩阵的数据表,包含已排序的列集合,是一个二维数据工具。每一列可以是不同的数据类型值。它既有行索引又有列索引,可以看作是一组共享相同索引的Series对 ...
分类:
编程语言 时间:
2020-02-20 13:00:58
阅读次数:
61