groupby函数 pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作,根据一个或多个键(可以是函数、数组、Series或DataFrame列名)拆分pandas对象,继而计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。 按照T ...
分类:
其他好文 时间:
2019-04-09 18:30:08
阅读次数:
283
数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。目前数据标准化方法有多种,归结起来可以分为直线型方法(如极值法、标准差法)、折线型方法(如三折线法)、曲线型方法(如半正态性分布)。不同的标准化方法,对系统的评价结果会产生不同的影响,然而不幸的是,在数据标准化方 ...
分类:
编程语言 时间:
2019-04-01 00:54:12
阅读次数:
179
1. batch_normalize(归一化操作),公式:传统的归一化公式 (number - mean) / std, mean表示均值, std表示标准差 而此时的公式是 scale * (num - mean) / std + beta #scale 和 beta在计算的过程中会进行不断的更新 ...
分类:
其他好文 时间:
2019-03-28 21:56:55
阅读次数:
289
三点估算:悲观36天,可能21天,乐观6天.在16至26天内完成的概率是多少?这个算法是PERT估算最终估算结果=(悲观工期+乐观工期+4×最可能工期)/6=(36+6++4*21)/6=21标准差=(悲观-乐观)/6=(36-6)/6=5带入公司计划PERT估算结果为:(36+21*4+6)/6= ...
分类:
其他好文 时间:
2019-03-14 00:38:38
阅读次数:
167
上Grafana官网下载Grafana,此产品只有64位的版本,没有32位的 Influxdb:InfluxDB是一个开源的时序数据库,使用GO语言开发,特别适合用于处理和分析资源监控数据这种时序相关数据。而InfluxDB自带的各种特殊函数如求标准差,随机取样数据,统计数据变化比等,使数据统计和实 ...
分类:
数据库 时间:
2019-02-17 01:03:08
阅读次数:
296
统计学习的基本概念(复习篇) 总体(population):根据研究目的确定的同类对象的全体(集合) 样本(sample):从总体中随机抽取的部分具有代表性的研究对象。 参数(Parameter):反映总体特征的统计指标,如总体均数、标准差等,是固定的常量。 统计量(statistic):反映样本特 ...
分类:
其他好文 时间:
2019-02-02 13:03:45
阅读次数:
221
很多刚进入实验室的同学对实验数据的标准差(SD)与标准误(SE)的含义搞不清,不知道自己的数据报告到底该用SD还是SE。这里对这两个概念进行一些介绍。 标准差(SD)强调raw data的Variation,而标准误(SE)强调平均数的可信程度。例如在毒理学实验中,可能少数个体出现不良反应也很重要, ...
分类:
其他好文 时间:
2019-01-16 13:02:58
阅读次数:
189
StandardScaler 计算训练集的平均值和标准差,以便测试数据集使用相同的变换 官方文档: class sklearn.preprocessing.StandardScaler(copy=True, with_mean=True, with_std=True) Standardize fea ...
分类:
其他好文 时间:
2019-01-04 12:30:10
阅读次数:
969
常用的数据变换方法 均值: 标准差: 中心化变换: 标准化变换: 极化正规化变换(规格化变换): 对数变换: 距离和相似系数 距离: 明氏距离: 当q=1时,为绝对距离 当q=2时,为欧式距离 当q=∞时,为切比雪夫距离 兰氏距离: 斜交空间距离: 马氏距离: 两样品间: 样品到总体: 相似系数: ...
分类:
其他好文 时间:
2019-01-01 17:54:48
阅读次数:
194
1、 What is a Z-Score? 简单地说,z分数就是数据距离均值有多少个标准差。但更严格地说,它衡量的是一个数值偏离总体均值以上或以下多少个标准差。z分数也称为标准分数,可以放在正态分布曲线上。z分数范围从-3个标准差(落在正态分布曲线的最左边)到+3个标准差(落在正态分布曲线的最右边) ...
分类:
其他好文 时间:
2019-01-01 15:25:32
阅读次数:
1112