编译的时候经常会遇到 ISO C90 forbids mixed declarations and code 警告百度了一下,知道是如下原因 : 变量定义之前任何一条非变量定义的语句(注意:语句是会带分号的)都会引起这个警告! 解决方法: 将非变量的定义移到变量定义之后 即可 编译的时候经常会遇到 ...
分类:
其他好文 时间:
2016-10-28 19:58:45
阅读次数:
158
问题到数据 理解问题 理解客户的问题:谁是客户(某航空公司)?交流,交流,交流! 问题要具体 某航空公司: 乘客体验如何?哪方面需要提高? 类别:比较、描述、聚类,判别还是回归 需要什么样的数据:现有数据,数据质量,需要收集的数据,自变量,因变量 哪些方面的满意度?哪些主要竞争对手? 内部数据?外部 ...
分类:
其他好文 时间:
2016-10-27 21:00:00
阅读次数:
347
数据挖掘主要分为4类,即预测、分类、聚类和关联,根据不同的挖掘目的选择相应的算法。下面对R语言中常用的数据挖掘包做一个汇总: 连续因变量的预测: stats包 lm函数,实现多元线性回归 stats包 glm函数,实现广义线性回归 stats包 nls函数,实现非线性最小二乘回归 rpart包 rp ...
分类:
编程语言 时间:
2016-10-19 13:33:45
阅读次数:
420
回归分析 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器,自变量数量可以是单个也可以是多个)之间的关系。 这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。 例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。 回归分析技术区别 回归分 ...
分类:
其他好文 时间:
2016-10-18 15:58:22
阅读次数:
211
最大似然估计 MLE 给定一堆数据,假如我们知道它是从某一种分布中随机取出来的,可是我们并不知道这个分布具体的参,即“模型已定,参数未知”。 例如,对于线性回归,我们假定样本是服从正态分布,但是不知道均值和方差;或者对于逻辑回归,我们假定样本是服从二项分布,但是不知道均值,逻辑回归公式得到的是因变量 ...
分类:
其他好文 时间:
2016-09-14 10:58:39
阅读次数:
183
数学模型可以看做是人们对复杂的现实问题进行简化描述的数学表达式,由于统计学来源于数学,因此在统计分析中,也普遍使用模型来分析问题。数学中模型的分类非常多,但统计学中最常用的模型是线性模型和非线性模型。在此,首先明确几个概念1.线性关系线性关系是指自变量和因变量之间成比例的关系,即增量之间有固定的比例 ...
分类:
其他好文 时间:
2016-09-03 19:56:12
阅读次数:
2335
这本《例解回归分析第5版》属于统计学精品译丛系列,这个系列的书都非常不错,以下是该书的阅读笔记 一、回归分析的步骤 1.问题陈述是指明确要分析研究的问题 2.选择相关变量选择用于解释因变量的自变量 3.收集数据收集的数据按照取值情况可以分为定量数据或定性数据,如果所有的自变量均为定性数据,此时的回归 ...
分类:
其他好文 时间:
2016-08-19 12:49:00
阅读次数:
3542
在线性回归问题中,我们假设,而在分类问题中,我们假设,它们都是广义线性模型的例子,而广义线性模型就是把自变量的线性预测函数当作因变量的估计值。很多模型都是基于广义线性模型的,例如,传统的线性回归模型,最大熵模型,Logistic回归,softmax回归。 指数分布族 在了解广义线性模型之前,先了解一 ...
分类:
其他好文 时间:
2016-08-14 07:38:51
阅读次数:
196
参看博文http://www.tuicool.com/articles/2qYjuy 逻辑回归的输出范围是[0,1],根据概率值来判断因变量属于0还是属于1 实现过程分三步: indicated function指示函数 ...
分类:
其他好文 时间:
2016-07-31 17:36:01
阅读次数:
127
Probit含义为概率单位,和Logistic回归一样,Probit回归也用于因变量为分类变量的情况,通常情况下,两种回归方法的结果非常接近,但是由于Probit回归的结果解释起来比较抽象不易理解,因此应用不如Logistic回归那样广泛。Probit回归是基于正态分布理论上进行的,而Logisti ...
分类:
其他好文 时间:
2016-07-24 19:29:24
阅读次数:
3908