在某些领域的分析中,常常用追踪的方式来研究事物的发展规律,比如研究某种药物的疗效,手术后的存活时间,某件机器的使用寿命等。这种分析的特点是追踪研究的对象都要经过一段时间,而且经常会碰到出于某种原因无法继续追踪的情况。生存分析就是用来研究这段追踪时间的分布规律以及相关因素的一种统计分析方法。一、生存分 ...
分类:
其他好文 时间:
2016-05-21 23:01:05
阅读次数:
4078
参考-《统计分析方法》-李航
第四章 朴素贝叶斯法
电脑可以将图像视频文字等呈现在人类面前但是它自己却没有判断力,并不能去这些信息进行分类和识别。机器学习就是为了让机器获得识别这些信息的能力。在机器学习中朴素贝叶斯是一种非常简单但是却应用十分广泛的分类方法。 朴素贝叶斯是基于贝叶斯的一种分类方法,它通过输入的训练数据集和类别标签来学习联合分布概率P(X,Y),然后利用P(X,Y)来对测试数据...
分类:
其他好文 时间:
2016-05-12 20:06:02
阅读次数:
123
交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set),首先用训练集对分类器进行训练,在利用验证集来测试训练得到的模型(model),以此来做为评价分类器的性能指标。于是可以先在一个子集上做分析, 而其它子...
分类:
其他好文 时间:
2016-05-06 12:49:29
阅读次数:
4398
R语言的主要功能包括数据统计分析方法和数据可视化,数据分析在这一章中主要学习创建基本图形和基本数据分析 一 基本图形 1条形图 barplot(height) //添加一个条形图,height是一个向量或矩阵// legend.text //为图例提供了各条形的标签// spine() //绘制棘状 ...
分类:
编程语言 时间:
2016-04-17 17:26:22
阅读次数:
218
交叉验证(CrossValidation)方法思想简介以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation
分类:
其他好文 时间:
2016-03-06 10:00:10
阅读次数:
131
1 数据分析概念 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,并将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来...
分类:
其他好文 时间:
2015-07-06 10:03:38
阅读次数:
114
a/b测试是ebay主要使用的算法优化方法。由于交易数据的长尾特性,用以比较测试组和控制组的 t假设检验方法敏感度不高。本文通过事后分层的统计分析方法,对a/b测试中的用户按照试验前线上行为的相似度进行分组,通过减少组内行为差异而减少试验方差,进而提高测试敏感度,改进试验效率。...
分类:
其他好文 时间:
2015-06-18 17:25:16
阅读次数:
233
什么是数据分析?
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总、理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出研究对象的内在规律。在实际 工作当中,数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动。
数据分析师指的是不同行业中,专门从事行业数据搜集...
分类:
其他好文 时间:
2015-04-27 18:31:10
阅读次数:
302
回归分析是研究两种或两种以上变量之间相互依赖的定量关系的统计分析方法,在很多行业都有广泛的应用。无论是银行、保险、电信等服务行业的业务分析人员在进行数据库营销、欺诈风险侦测,还是半导体、电子、化工、医药、钢铁等制造行业的研发技术人员在进行新产品实验设计与分析、流程优化与过程监控,或者更广义地说,不同...
分类:
其他好文 时间:
2015-04-05 21:53:50
阅读次数:
157
主成分分析(Principal Component Analysis,PCA)是将多个变量通过线性变换以选出较少几个重要变量的多元统计分析方法。
原理:在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析...
分类:
其他好文 时间:
2015-04-04 00:02:08
阅读次数:
371