k means算法在人群聚类场景中,是一个非常实用的工具。(该算法的原理可以参考 "K Means算法的Python实现" ) 常见调用方式 该算法常规的调用方式如下: 异常现象 常规情况下,以上处理后,会根据dataframe上的索引列顺序的 (0~8的数值)。 但是,我们在执行代码过程中,出现了 ...
分类:
编程语言 时间:
2019-08-27 23:31:05
阅读次数:
492
1、理论铺垫 Dataframe和Series均适用 ~集中趋势:均值mean()、中位数median()、与分位数quantile(q=0.25)、众数mode() ~离中趋势:标准差std()、方差var() import scipy.stats as ss 正态分布:ss.norm 、卡方分布 ...
分类:
其他好文 时间:
2019-08-27 21:13:27
阅读次数:
110
pandas.DataFrame.to_hdf(self, path_or_buf, key, **kwargs) https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_hdf.html http ...
分类:
其他好文 时间:
2019-08-27 21:09:12
阅读次数:
66
sklearn Key_Word sklearn, datasets, DataFrame, load_* preprocessing, MinMaxScaler, scaler, fit, transform, data, target sklearn数据获取 数据的预处理 数据的标准化: 将每一 ...
分类:
其他好文 时间:
2019-08-25 16:22:32
阅读次数:
179
创建DataFrame 列表创建DataFrame 单个列表 列表套列表 ndarrays/Lists[多维数组]的字典来创建DataFrame 指定索引 字典列表创建DataFrame 【列表中套字典】 使用字典,行索引和列索引列表创建DataFrame 从Series的字典来创建数据帧 字典的系 ...
分类:
其他好文 时间:
2019-08-25 16:16:21
阅读次数:
62
pd.set_option('display.float_format', lambda x: '%.3f' % x) 参考文献: https://www.jianshu.com/p/9bfe9aeeb8a6 ...
分类:
其他好文 时间:
2019-08-22 19:18:27
阅读次数:
456
平时处理数据时,经常遇到只需要数据中的其中几列,于是就需要将对应列拿出并单独创建为新的DataFrame框架数据,在此记录一下; 类似字符串切片的形式,用中括号进行选取,需要多列时再用中括号将不同列归纳到一起,具体如下图: data是共享单车的轨迹数据,可以看到data共有7个字段的数据。于此,我需 ...
分类:
其他好文 时间:
2019-08-15 15:55:47
阅读次数:
218
在django中使用pandas操作django的ORM查询出来的QuerySet对象,可以使用插件django-pandas。 截止教程书写时间,django-pandas已发布到0.6.1。 依赖:django>=1.4.5 Django-model-utils >=1.4.0 Pandas > ...
分类:
其他好文 时间:
2019-08-13 00:26:38
阅读次数:
628
在juoyter notebook中直接通过df输出DataFrame时,显示的样式为表格样式,通过sytle可对表格的样式做一些定制,类似excel的条件格式。 对表格创建样式有两种方式,都需要额外定义一个处理样式的函数 ①df.style.applymap(func,*args,**kwargs ...
分类:
其他好文 时间:
2019-08-11 22:48:28
阅读次数:
251
Python3快速入门(十三)——Pandas数据结构一、Pandas数据结构简介Pandas有三种主要数据结构,Series、DataFrame、Panel。Series是带有标签的一维数组,可以保存任何数据类型(整数,字符串,浮点数,Python对象等),轴标签统称为索引(index)。DataFrame是带有标签的二维数据结构,具有index(行标签)和columns(列标签)。如果传递in
分类:
编程语言 时间:
2019-08-09 22:05:05
阅读次数:
78