import numpy as nparr = [1,2,3,4,5,6]#求均值arr_mean = np.mean(arr)#求方差arr_var = np.var(arr)#求标准差arr_std = np.std(arr,ddof=1)print("平均值为:%f" % arr_mean)p ...
分类:
编程语言 时间:
2019-11-05 15:02:54
阅读次数:
173
Z-score标准化 Z-score标准化后数据的均值为0,标准差为1。主要目的是将不同量级的数据统一转化为同一个量级以保证数据之间的可比性。 min-max标准化 min-max标准化将数据映射到[0,1]之间。适用于需要一定范围的数据的处理,例如图像处理时像素必须规范到确定的范围[0,255]。 ...
分类:
其他好文 时间:
2019-11-04 19:26:01
阅读次数:
85
Tukey法 在介绍Tukey方法前,首先了解学生化极差分布。 在概率论和统计学中,学生化极差分布是极差的抽样分布。该分布是一种连续型概率分布,用于在样本量较小且总体标准差未知的情况下估计正态分布总体的极差。 假设要比较的组数为k,那么在零假设成立的条件下,下面的随机变量服从学生化极差分布。 ...
分类:
其他好文 时间:
2019-11-01 21:00:08
阅读次数:
109
4 二项分布近似正态分布的条件? 参数和统计量的区别? 总体参数通常用希腊字母表示,样本统计量通常用小写英文字母来表示 抽样分布是一种理论分布吗? 抽样分布不是样本结果的分布,而是一种无法穷尽情况的分布,但是我们可以使用数学方法来求得进行这样抽取方法后的特统计量的分布。我们收取的样本点的统计量被认为 ...
分类:
其他好文 时间:
2019-11-01 20:47:55
阅读次数:
120
描述性统计分析方法是只应用分类、制表、图形及概括性数据指标(如均值、方差等)来概括数据分布特征的方法。 描述数据特征的统计量可分为两类:一类表示数据的中心位置,如均值、中位数、众数等;另一类表示数据的离散程度,如方差、标准、差极差等用来衡量个体偏离中心的程度。 在描述定性观测值时,有时候我们需要把这 ...
分类:
其他好文 时间:
2019-10-31 20:09:30
阅读次数:
114
根据中心极限定理,我们可以用样本估计总体的平均值。那么,如果通过n个样本估计总体的标准差则需要除以n-1,这是为什么呢? 标准差是描述数据与平均值的偏离程度。 而因为样本的数据量比总体的数据量少,因此很可能会去除掉一些极端值,使得样本的标准差小于总体标准差。 因此,为了更好的用样本估计总体的标准差, ...
分类:
其他好文 时间:
2019-10-27 13:11:49
阅读次数:
1319
pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。对DataFrame的列应用各种各样的函数。应 ...
分类:
其他好文 时间:
2019-10-22 23:37:42
阅读次数:
109
从多元正态分布中抽取随机样本。 多元正态分布,多正态分布或高斯分布是一维正态分布向更高维度的推广。这种分布由其均值和协方差矩阵来确定。这些参数类似于一维正态分布的平均值(平均值或“中心”)和方差(标准差或“宽度”,平方)。 np.random.multivariate_normal方法用于根据实际情 ...
分类:
其他好文 时间:
2019-10-22 22:27:52
阅读次数:
176
1. 数据归一化的好处 (1)提升训练的速度 (2)提升模型的精度 (3)深度模型中能够防止梯度爆炸 2 归一化方法 min-max 归一化 x = (x - x_min)/(x_max - x_min) 将x 映射到[0,1]之间的一个数 z-score 标准化 均值为0 ,标准差为1 3 min ...
分类:
其他好文 时间:
2019-10-22 01:09:44
阅读次数:
131
Problem 51nod近日上线了用户满意度检测工具,使用高级人工智能算法,通过用户访问时间、鼠标轨迹等特征计算用户对于网站的满意程度。 现有的统计工具只能统计某一个窗口中,用户的满意程度的均值。夹克老爷想让你为统计工具添加一个新feature,即在统计均值的同时,计算窗口中满意程度的标准差和中位 ...
分类:
编程语言 时间:
2019-10-12 22:29:09
阅读次数:
88