有时候我们根据需要要研究数据集中某些属性和指定属性的相关性,显然我们可以使用一般的统计学方法解决这个问题,下面简单介绍两种相关性分析方法,不细说具体的方法的过程和原理,只是简单的做个介绍,由于理解可能不是很深刻,望大家谅解。1、Pearson相关系数 最常用的相关系数,又称积差相关系数,取值-...
分类:
其他好文 时间:
2014-12-11 22:20:19
阅读次数:
686
一、平均值①算术平均数,也叫均值,分为简单算术平均数、加权算术平均数。它主要适用于数值型数据,不适用于品质数据。 算术平均数是加权平均数的一种特殊形式(特殊在各项的权重相等)。在实际问题中,当各项权重不相等时,计算平均数时就要采用加权平均数;当各项权相等时,计算平均数就要采用算术平均数。②加权平.....
分类:
其他好文 时间:
2014-12-10 17:52:25
阅读次数:
134
Cox比例风险回归模型(Cox’s proportional hazards regression model),简称Cox回归模型。该模型由英国统计学家D.R.Cox于1972年提出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。h(t/X)=h0(t) exp (β1 X1 + β2 X2 + …… + βp Xp )h0(t): 基准风险函数 即所有变量取零时的t时刻的风险...
分类:
其他好文 时间:
2014-12-08 10:50:43
阅读次数:
165
一、统计学的基本概念统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值:标准差:方差:均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0, ...
分类:
其他好文 时间:
2014-12-06 09:58:59
阅读次数:
137
在统计学上, 广义线性模型 (Generalized linear model) 是一种受到广泛应用的线性回归模式。此模式假设实验者所量测的随机变量的分布函数与实验中系统性效应(即非随机的效应)可经由一链结函数(link function)建立起可资解释其相关性的函数。广义线性模型(generalized linear model, GLM)是简单最小二乘回归(OLS)的扩展,在广义线性模式中,假...
分类:
其他好文 时间:
2014-12-06 00:10:49
阅读次数:
269
本题要求编写程序读入N个学生的百分制成绩,统计五分制成绩的分布。百分制成绩到五分制成绩的转换规则:
大于等于90分为A;
小于90且大于等于80为B;
小于80且大于等于70为C;
小于70且大于等于60为D;
小于60为E。
输入格式:
输入在第1行中给出1个正整数N(
输出格式:
在一行中输出A、B、C、D、E对应的五分制成绩的人数分布,数...
分类:
其他好文 时间:
2014-12-02 13:37:04
阅读次数:
1860
今天,我要介绍我们早就知道的一种分布,它叫做高斯分布。高斯分布在概率论中算是比较核心的一种分布了,而在机器学习中,高斯分布也随处可见,比如单高斯模型,高斯混合模型,高斯过程等等,它们都是基于高斯分布的。作为理解连续性随机变量的基础和深入理解在机器学习中的广泛应用,高斯分布是十分有必要学习的。
高斯分布又叫做正态分布,高斯分布概率密度函数的函数形式是由德国著名的天才数学家、统计学家、物理学家...
分类:
其他好文 时间:
2014-12-02 11:50:57
阅读次数:
262
统计学习是基于数据构建统计模型从而对数据进行预测与分析,统计学习由监督学习,非监督学习,半监督学习和强化学习等组成
统计学习由模型的假设空间(学习的模型属于某个函数的集合),模型选择的准则,及模型学习的算法
分类:
其他好文 时间:
2014-11-29 21:31:23
阅读次数:
173
何谓MVC(Model View Controller):M是指业务模型,V是指用户界面,C则是控制器,使用MVC的目的是将M和V的实现代码分离,从而使同一个程序可以使用不同的表现形式。比如统计学生数据可以分别用柱状图、饼形图来表示。C存在的目的则是确保M和V的同步,一旦M改变,V应该同步更新。...
分类:
Web程序 时间:
2014-11-29 16:00:15
阅读次数:
222