码迷,mamicode.com
首页 > 其他好文 > 详细

高等数理统计(四)

时间:2015-11-23 18:51:35      阅读:325      评论:0      收藏:0      [点我收藏+]

标签:

引言

  【比较官方的简介】数理统计学是一门以概率论为基础,应用性很强的学科。它研究怎样以有效的方式收集、 整理和分析带有随机性的数据,以便对所考察的问题作出正确的推断和预测,为采取正确的决策和行动提供依据和建议。数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。

  【简单的讲】,就是通过样本分析来推断整体。

  【意义或者重要性】在这个大数据时代,数据是非常重要的。怎样挖掘数据内部的规律或者隐含的信息,变得尤为重要。当时我们是不可能获得整体的数据的,所以我们只能通过抽取样本,进而通过样本来推断整体的规律。

  【目录】

  第一章、样本与统计量

    一、引言:

    二、总体与样本:

    三、统计量:

    四、常用分布:

  第二章、参数估计

    一、引言:

    二、点估计——矩估计法

    三、点估计——极大似然估计

    四、估计量的优良性准则

    五、区间估计——正态分布

      1、引入

      2、单个正态总体参数的区间估计

      3、两个正态总体的区间估计

    六、区间估计——非正态分布:

      1、大样本正态近似法

      2、二项分布

      3、泊松分布

  第三章、假设检验

    一、引言:

    二、正态总体均值的假设检验

      1、单正态总体 N(μ, σ2)均值 μ 的检验

        (1) 双边检验 H0: μ = μ0;H1: μ≠μ0 

        (2) 单边检验 H0: μ = μ0;H1: μ>μ0

      2、两个正态总体 N(μ1, σ12) 和  N(μ2, σ22)均值的比较

        (1) 双边检验 H0μ1 = μ2;H1μ1μ2 

          (2) 单边检验 H0μ1 >= μ2;H1μ1<μ2 

        (3) 单边检验 H0μ1 <= μ2;H1μ1>μ2 

    三、正态总体方差的检验

      1、单个正态总体方差的 χ2 检验

        (1) H0: σ2 =σ02;H1: σ2 ≠σ02

        (2) H0: σ2 =σ02;H1: σ2 >σ02

        (3)  H0σ2 ≤σ02;H1σ2 > σ02 (同2.)

      2、两正态总体方差比的 F 检验

         (1).  H0: σ12 = σ22;H1: σ12 ≠  σ22.

         (2) H0: σ12 = σ22;H1:    σ12> σ22

         (3) H0: σ12 ≤ σ22;H1:    σ12> σ22

   第四章、回归分析

    一、引言

 

 

 

 

第四章、回归分析

  一、引言:

  变量间的两类关系:十九世纪,英国生物学家兼统计学家高尔顿研究发现:技术分享

     其中x表示父亲身高, y 表示成年儿子的身高(单位:英寸,1英寸=2.54厘米)。这表明子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其它分支中。

    Ø 回归分析处理的是变量与变量间的关系。变量间常见的关系有两类:确定性关系与相关关系
    Ø 变量间的相关关系不能用完全确切的函数形式表示,但在平均意义下有一定的定量关系表达式,寻找这种定量关系表达式就是回归分析的主要任务。
    Ø 回归分析便是研究变量间相关关系的一门学科。它通过对客观事物中变量的大量观察或试验获得的数据,去寻找隐藏在数据背后的相关关系,给出它们的表达形式——回归函数的估计
  
  二、一元线性回归
  1、一元线性回归模型

  设y与x间有相关关系,称x为自变量(预报变量),y为因变量(响应变量),在知道x取值后,y有一个分布p(y|x),我们关心的是y的均值E(Y|x)

    技术分享

  这便是y关于x的理论回归函数——条件期望,也就是我们要寻找的相关关系的表达式。通常,相关关系可用下式表示:y =f (x)+ ε,其中ε是随机误差,一般假设ε ~N(0,σ2)

  进行回归分析首先是回归函数形式的选择。当只有一个自变量时,通常可采用画散点图 的方法进行选择。

  【例1】合金的强度y (×107Pa) 与合金中碳的含量x (%) 有关。为研究两个变量间的关系。首先是收集数据,我们把收集到的数据记为(xi,yi) ,i=1,2, ... , n。本例中,我们收集到12组数据,列于表1中

    技术分享

  为找出两个量间存在的回归函数的形式,可以画一张图:把每一对数(xi,yi)看成直角坐标系中的一个点,在图上画出n个点,称这张图为散点图,见图1

    技术分享

  从散点图我们发现12个点基本在一条直线附近,这说明两个变量之间有一个线性相关关系,这个相关关系可以表示为

                        y =Β0+ Β1x+ ε                                        (2)

    这便是y关于x的一元线性回归的数据结构式。通常假定

                        E(ε) =0,  Var(ε) = σ                                                     (3)

    在对未知参数作区间估计或假设检验时,还需要假定误差服从正态分布,即

                        y ~N(Β0+ Β1x , σ2 )                                 (4)

  显然,假定(4) 比 (3) 要强。

  由于 Β0, Β1均未知,需要我们从收集到的数据(xi,yi),i=1,2,…,n,出发进行估计。在收集数据时,我们一般要求观察独立地进行,即假定y1, y2,…, yn,相互独立。综合上述诸项假定,我们可以给出最简单、常用的一元线性回归的数学模型:

    技术分享

  由数据(xi,yi),i=1,2,…,n,可以获得Β0, Β1的估计 技术分享,称

    技术分享

  为y关于x的经验回归函数,简称为回归方程,其图形称为回归直线。给定x=x0后, 称技术分享回归值(在不同场合也称其为拟合值、预测值)

  2、回归系数的最小二乘估计:

    技术分享

    技术分享

    技术分享

高等数理统计(四)

标签:

原文地址:http://www.cnblogs.com/mo-wang/p/4988754.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!