异常值(outlier)是指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍。importnumpyasnpdeffunction(arrayMatrix):arraystd=np.std(arrayMatrix,1,ddof=1)[:,np.newaxis]arraymean=np.mean(arrayMatrix,1)[:,np.newaxis]arrayoutlier
分类:
其他好文 时间:
2018-11-15 14:31:53
阅读次数:
357
分布形态 一个重要的数值度量被称为 偏度 。 z 分数 z 分数被称为标准化数值 z 分数 = 平均数的离差 / s代表样本标准差 切比雪夫定理 能使我们指出与平均数的距离在某个特定个数的标准差之内的数据值所占的比例 看实例: 假设100个学生平均成绩70,标准差5 那么你要预估大概58 82的区间 ...
分类:
其他好文 时间:
2018-11-09 19:21:26
阅读次数:
1838
变异程度的度量(离散程度的度量) 交货时间的变异性造成按时完成生产任务的不确定性 极差 极差=最大值 最小值 最简单的变异程度的度量 但很少单独用来度量变异程度。仅有两个观测值,异受极端值的影响 四分位数间距 能够克服极端值的影响,因为四分位数是中间的50%数据的极差. 方差 是用所有数据对变异程度 ...
分类:
其他好文 时间:
2018-11-07 20:05:24
阅读次数:
1530
描述性统计分析主要包括 基本信息:样本数、总和 集中趋势:均值、中位数、众数 离散趋势:方差(标准差)、变异系数、全距(最小值、最大值)、内四分位距(25%分位数、75%分位数) 分布描述:峰度系数、偏度系数 相关R描述性统计包与函数-- 1.1、自带summary函数 myvars <- c("m ...
分类:
其他好文 时间:
2018-10-28 13:41:52
阅读次数:
393
InfluxDB是一个开源的时序数据库,使用GO语言开发,特别适合用于处理和分析资源监控数据这种时序相关数据。而InfluxDB自带的各种特殊函数如求标准差,随机取样数据,统计数据变化比等,使数据统计和实时分析变得十分方便。在我们的容器资源监控系统中,就采用了InfluxDB存储cadvisor的监 ...
分类:
数据库 时间:
2018-10-27 17:11:10
阅读次数:
446
1.2.18累加器的方差。以下代码为Accumulator类添加了var()和stddev()方法,它们计算了addDatavalue()方法的参数的方差和标准差,验证这段代码。public class Accumulator{ private double m; private double s; ...
分类:
其他好文 时间:
2018-10-25 14:21:12
阅读次数:
140
tuple 元组(创建后不能修改) set 集合 list 列表 字典 计算平均数,和标准差 统计词频(哈利波特1) ...
分类:
编程语言 时间:
2018-10-20 19:47:15
阅读次数:
293
一,数据分析与挖掘简介 所谓数据分析,是对已有的数据进行分析,提取一些有价值的信息,比如平均数,标准差等。而数据挖掘,是对大量的信息进行分析和挖掘,得到一些未知的,有价值的信息。如今日头条类的新闻推送就是通过对用户的信息进行分析和挖掘,从而达到精准推送用户感兴趣的新闻。数据分析和数据挖掘往往是密不可 ...
分类:
编程语言 时间:
2018-10-19 02:15:13
阅读次数:
189
U40620 niiickの还没想好名字的题 给定一个长度为$n$的序列$a_1,a_2...,a_n$ 要求将这$n$个数分为$m$组,每组可以有任意多个数,但同一组中的数必须是原序列中连续的一段 求如何分组能使得各组的标准差最小, 即求$$min(\sqrt{\sum_{i=1}^m\frac{ ...
分类:
其他好文 时间:
2018-10-17 22:11:36
阅读次数:
153
统计量 统计量 通过从总体中抽取样本构造适当的统计量,由样本性质推断总体性质的样本函数。 常用的统计量 1)样本均值 2)样本方差、标准差 3)样本的变异系数——C=根号(D(x))/E(x) 4)k阶距 5)中心距 6)样本偏度 7)样本峰度 注:偏度、峰度在质量控制和可靠性研究应用较多。 次序统 ...
分类:
其他好文 时间:
2018-10-05 12:25:58
阅读次数:
195