机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM,GBDT,Adaboost,现在深度学习很火热,神经网络也是一个不错的选择。假如你在乎精度(ac ...
分类:
编程语言 时间:
2017-03-12 01:15:55
阅读次数:
1345
Ask: 什么是预测区间,置信区间和预测区间二者的异同是什么? Answer: 置信区间估计(confidence interval estimate):利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的估计区间。预测区间估计(prediction interval ...
分类:
其他好文 时间:
2016-05-29 10:59:19
阅读次数:
296
转载一直做着的不确定性分析,很多时候会涉及到置信区间的概念,但一直没能有个清晰的认识,今天终于从网上查资料,具体核实了置信区间的含义。95%置信区间(Confidence Interval,CI):当给出某个估计值的95%置信区间为【a,b】时,可以理解为我们有95%的信心(Confidence)可...
分类:
其他好文 时间:
2015-12-30 10:29:52
阅读次数:
1216
统计调查:咨询老师,电脑是否是核心工具,这属于bernoulli分布。p=142/250=0.57deviation=math.sqrt(p*(1-p))=0.5用样本标准差近似代替标准差0.5standard_error=0.5/math.sqrt(250)=0.03百分之99的范围表示2.6个标...
分类:
其他好文 时间:
2015-11-04 21:11:12
阅读次数:
1112
综合程序运行情况,样本调查中,结合成本因素,1000人样本足够。1000人样本可以满足95%置信度,d=3%偏离程度,标准误差1.5%精确情况:99%置信度,d=3%偏离程度,标准误差1%,样本数要求2000人左右(精确值1842)。#coding=-utf8#计算最小样本#计算置信区间#非精确计算...
分类:
其他好文 时间:
2015-10-16 18:56:04
阅读次数:
764
在统计学中,当同时考虑一系列的统计推断或者基于观察值选择的参数的子集时会发生多重比较的问题(Multiple comparisons problem)。原因:当一个人把子集作为整体的估计时,错误的推断很可能发生,包括置信区间没有包含相应的总体参数或者是假设检验错误地拒绝了零假设。对此,我举出两个例子...
分类:
其他好文 时间:
2015-08-31 11:34:09
阅读次数:
124
6.3两正态总体的区间估计(1)两个总体的方差已知在R中编写计算置信区间的函数twosample.ci()如下,输入参数为样本x, y,置信度α和两个样本的标准差。> twosample.ci=function(x,y,alpha,sigma1,sigma2){+ n1=length(x);n2.....
分类:
编程语言 时间:
2015-05-23 23:52:49
阅读次数:
362
介绍在这篇文章中,我将展示如何绘制二维正态分布数据的误差椭圆,又名置信椭圆。误差椭圆代表高斯分布的等值轮廓线,并允许可视化一个2D置信区间。下图显示了一组二维正态分布数据样本的95%置信椭圆。这个置信椭圆定义的区域包含了95%的样本,这些样本可以从潜在高斯分布中得到。
在接下来的章节中,我们将讨论如何获得不同置信度(如99%置信区间)的置信椭圆,我们将展示如何用Matlab或C ++代码绘制这些椭...
分类:
其他好文 时间:
2015-05-23 08:49:26
阅读次数:
8927
卡方分布(chi-square distribution, χ²-distribution)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。若k个随机变量、……、是相互独立,符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量Z的平方和被...
分类:
其他好文 时间:
2015-04-01 17:54:00
阅读次数:
496