一个变量apr_data,不论他是list、tuple、dataframe还是其它类型,如何获取它的名字'var'呢? 本来以为这个是比较简单的问题,网上一搜还真不简单,很多用inspect库或者其它复杂方法操作的, 请教了高手,可以这样实现。 a = dict(apr_data = apr_dat ...
分类:
编程语言 时间:
2020-06-29 11:53:41
阅读次数:
140
简介 在pandas中有两类非常重要的数据结构,即序列Series和数据框DataFrame。Series类似于numpy中的一维数组,除了通吃一维数组可用的函数或方法,而且其可通过索引标签的方式获取数据,还具有索引的自动对齐功能;DataFrame类似于numpy中的二维数组,同样可以通用nump ...
分类:
其他好文 时间:
2020-06-29 09:54:34
阅读次数:
35
a=['序号',1,2,3,4,5] b=['成本',20,45,12,34,67] import pandas c=pandas.Series(a) d=pandas.Series(b) e=pandas.DataFrame(list(zip(c,d))) print(e) 0 1 0 序号 成本 ...
分类:
其他好文 时间:
2020-06-26 18:03:16
阅读次数:
42
a = frame.drop_duplicates(subset=['pop'],keep='first') #保留重复数据的第一个 b = frame.drop_duplicates(subset=['pop'],keep=False) #去掉重复的数据 ...
分类:
其他好文 时间:
2020-06-26 16:06:44
阅读次数:
40
def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and modify the data type to reduce memory usage. """ start_mem = df.memor ...
分类:
其他好文 时间:
2020-06-25 21:10:13
阅读次数:
70
package test import org.apache.spark.sql.{DataFrame, ForeachWriter, Row, SparkSession} import org.apache.spark.sql.streaming.{ProcessingTime, Trigger} ...
分类:
数据库 时间:
2020-06-24 16:23:50
阅读次数:
132
# Series 以为,带标签数组 # DataFrame二维,Series容器 import string import pandas as pd import numpy as np # t = pd.Series(np.arange(10), index=list(string.ascii_u ...
分类:
其他好文 时间:
2020-06-22 23:16:15
阅读次数:
66
有时需要根据条件,访问DataFrame中的数据。例如,找出电影数据集中,某个导演的电影: # 加载数据 movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title") movies_df.columns = ['rank', 'g ...
分类:
编程语言 时间:
2020-06-21 22:57:55
阅读次数:
81
describe 在整个DataFrame上使用describe(),我们可以得到一个统计结果: import pandas as pd # 加载数据 movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title") movies_d ...
分类:
编程语言 时间:
2020-06-21 21:46:01
阅读次数:
81