无监督分箱法: 等距划分、等频划分 等距分箱 从最小值到最大值之间,均分为 N 等份, 这样, 如果 A,B 为最小最大值, 则每个区间的长度为 W=(B?A)/N , 则区间边界值为A+W,A+2W,….A+(N?1)W 。这里只考虑边界,每个等份里面的实例数量可能不等。 等频分箱 区间的边界值要 ...
分类:
其他好文 时间:
2020-08-20 19:01:01
阅读次数:
248
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 20:38:09
阅读次数:
60
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 10:32:24
阅读次数:
53
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-09 09:15:43
阅读次数:
65
系列文章: https://preppindata.blogspot.com/p/how-toprep-index.html 如何计划你的prep 阶段1: 了解你的数据 不了解数据,就没法得到想要的分析结果。对于小型的数据集,可以这么做: 列,行,交叉表是如何组织结构的 header标题(列名)和 ...
分类:
其他好文 时间:
2020-04-27 17:38:54
阅读次数:
77
前段时间工作上面有一个需求,用户想要自己通过切片器来控制坐标轴的维度,那么这遍文章我就主要是要介绍一下如何制作动态的坐标轴。 这次分析的数据是销售的最低价格,分别从周日期、天日期和promotions三个维度进行分析,要实现的效果是,如果选择了WEEK,那坐标轴就是周的名称,展示周的最低销售价格,如 ...
分类:
其他好文 时间:
2020-03-12 15:50:33
阅读次数:
223
import numpy as np import pandas as pd from pandas import Series,DataFrame 一、透视表(pivotTab) 透视表就是将指定原有DataFrame的列分别作为行索引和列索引,然后对指定的列应用聚集函数(默认情况下式mean函数 ...
分类:
其他好文 时间:
2019-12-22 11:10:21
阅读次数:
132
交叉表与透视表什么作用 分析两个离散值值间得相关性 探究股票的涨跌与星期几有关? 以下图当中表示,week代表星期几,1,0代表这一天股票的涨跌幅是好还是坏,里面的数据代表比例 可以理解为所有时间为星期一等等的数据当中涨跌幅好坏的比例 使用crosstab(交叉表)实现上图 交叉表:交叉表用于计算一 ...
分类:
其他好文 时间:
2019-09-09 21:09:31
阅读次数:
110
一、外键简介 外键表示一个表中的一个字段被另一个表中的一个字段引用。外键对相关表中的数据造成了限制,使MySQL能够保持参照完整性。 下面来看看示例数据库(yiibaidb)中的以下数据库中两个表:customers和`orders``的ER图。 上图中有两张表:customers和orders。每 ...
分类:
数据库 时间:
2019-09-03 18:06:58
阅读次数:
116
一、数据透视表 类比excel的数据透视表进行理解,可使用pd.pivot_table( df , ...),也可直接使用df/pivot_table( ... ) values:透视后对哪一列进行计算 index:按照哪一列进行分组 columns:透视后除了values,还包含哪些列 aggfu ...
分类:
其他好文 时间:
2019-08-04 15:33:17
阅读次数:
181