统计学习的基本概念(复习篇) 总体(population):根据研究目的确定的同类对象的全体(集合) 样本(sample):从总体中随机抽取的部分具有代表性的研究对象。 参数(Parameter):反映总体特征的统计指标,如总体均数、标准差等,是固定的常量。 统计量(statistic):反映样本特 ...
分类:
其他好文 时间:
2019-02-02 13:03:45
阅读次数:
221
作为一名非统计学科班出身的同学,之前只学习过浙大《概率论与数理统计》一书,当时只在意那些公式、理论,应付考试,甚至不知道书中讲述了两门学科的知识:数理统计学、概率论,更不明白二者之间有何关系,直到最近拜读了陈希孺先生的《数理统计学教程》,这才开始有一些理解,于是打算先将自己的一些理解记录下来,待日后 ...
分类:
其他好文 时间:
2019-01-19 19:56:51
阅读次数:
258
点估计指的是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。在这个定义中,总体参数也即是总体分布的参数,一般我们在讨论总体分布的时候,只有在简单随机样本(样本独立同分布)情况下才有明确的意义,总体分布才能决定样本分布,所以下文样本中各随机变 ...
分类:
其他好文 时间:
2019-01-19 19:55:33
阅读次数:
2173
群体遗传学中衡量群体间分化程度的指标有很多种,最常用的就是Fst指数。 Fst指数,由F统计量演变而来。F统计量(FIS,FIF,FST)主要有三种。 Fst是针对一对等位基因,如果基因座上存在复等位基因,则需要用Gst衡量,基因差异分化系数(gene differentiation coeffic ...
分类:
其他好文 时间:
2019-01-18 22:26:06
阅读次数:
456
SPSS频率分析---对公司购物网站用户消费行为以及消费态度进行分析 频率分析频率分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征,以便我们对数据的分布特征形成初步的认识,发现隐藏在数据背后的信息,为后续数据分析提供了方向和依据。频率分析主要包括分类变量... ...
分类:
其他好文 时间:
2019-01-18 10:18:22
阅读次数:
259
1.协方差 方差是描述自身偏离其均值的程度。 协方差用来描述两个变量间的变化关系,协方差用来度量两个随机变量关系的统计量 $$ cov(X,Y)=E[(X E[X])(Y E[Y])] $$ $$ cov(X,Y)=E[(X μ_x)(Y μ_y)] $$ E[x] 代表期望,一般置X的均值 公式: ...
分类:
其他好文 时间:
2019-01-05 16:39:47
阅读次数:
244
1、What is a Chi Square Test? 卡方检验有两种类型。两者使用卡方统计量和分布的目的不同。 第一种:卡方拟合优度检验确定样本数据是否与总体匹配。(这里不介绍) 第二种:独立性的卡方检验比较列联表中的两个变量,看看它们是否相关。在更一般的意义上,它测试分类变量的分布是否不同。 ...
分类:
其他好文 时间:
2019-01-01 17:17:39
阅读次数:
169
1、what is the Definition of a Confidence Interval? 置信区间是特定统计量的不确定性。置信区间通常有误差范围。它告诉你,你有多大的信心,从民意调查或调查的结果,反映出你会发现什么,如果有可能调查整个群体。置信区间与置信水平(confidence lev ...
分类:
其他好文 时间:
2019-01-01 11:44:26
阅读次数:
218
题目描述 给定3个整数A, B, C, 和数组第一个数a[1]。数组a由如下方式得到。询问a中第k小的数是多少。 for(int i = 2; i <= 3000000; ++i) a[i] = ((1LL * a[i - 1] * A ^ B) + C) % 1000000007; 输入 多组组数 ...
分类:
编程语言 时间:
2018-12-27 20:27:52
阅读次数:
394
1.点估计 令 {x (1) ,...,x (m) } 是 m 个独立同分布(i.i.d.)的数据点。点估计(point esti-mator)或统计量(statistics)是这些数据的任意函数: 良好的估计量的输出会接近生成训练数据的真实参数 θ 点估计也可以指输入和目标变量之间关系的估计。我们 ...
分类:
其他好文 时间:
2018-11-29 01:23:20
阅读次数:
167