摘要:目前经典的统计学分析方法主要有回归分析,Logistic回归,决策树,支持向量机,聚类分析,关联分析,主成分分析,对应分析,因子分析等,那么对于这些经典的分析方法在R中的使用主要有那些程序包及函数呢?1、线性模型~回归分析:【包】:stats 【函数】:lm(formula, data, .....
分类:
其他好文 时间:
2015-01-23 14:41:06
阅读次数:
407
【转载】典型关联分析(Canonical Correlation Analysis)
分类:
其他好文 时间:
2015-01-16 12:55:50
阅读次数:
114
1.支持度(Support)
支持度表示项集{X,Y}在总项集里出现的概率。公式为:
Support(X→Y) = P(X,Y) / P(I) = P(X∪Y) / P(I) = num(XUY) / num(I)
其中,I表示总项集。num()表示求项集个数
2.置信度 (Confidence)
置信度表示在先决条件X发生的情况下,由关联规则...
分类:
其他好文 时间:
2015-01-15 22:13:22
阅读次数:
203
前言 想必大家都听过数据挖掘领域那个经典的故事 - "啤酒与尿布" 的故事。 那么,具体是怎么从海量销售信息中挖掘出啤酒和尿布之间的关系呢? 这就是关联分析所要完成的任务了。 本文将讲解关联分析领域中最为经典的Apriori算法,并给出具体的代码实现。关联分析领域的一些概念 1. 频繁项集...
分类:
编程语言 时间:
2015-01-09 17:13:21
阅读次数:
188
数据抽象
序列(sequence):表示一个完整的信息流.
数据项(item):序列中最小组成单位的集合
事件(event):通常使用时间戳来表示,用于标识同一个序列内不同数据项之间的前后顺序关系。
在网站分析中,可以使用序列模式的关联分析来研究用户的点击行为流,并衡量页面的体验以及易用性效果。
(该实例来自 李明 《R语言与网站分析》中例子)
读取数据
# (1)使用read....
分类:
其他好文 时间:
2014-12-26 14:48:13
阅读次数:
1036
提到数据挖掘,我们第一反应就是之前听到的啤酒和尿不湿的故事,该故事就是典型的数据挖掘中的关联规则。购物篮分析区别于传统的线性回归的主要区别为,关联分析针对离散数据;
常见关联规则:
关联规则:牛奶=>鸡蛋【支持度=2%,置信度=60%】
支持度:分析中的全部事务的2%同时购买了牛奶和鸡蛋,需设定域值,来限定规则的产生;
置信度:购买了牛奶的筒子有60%也购买了鸡蛋,需设定域值,来限定规则的...
分类:
编程语言 时间:
2014-12-23 12:34:32
阅读次数:
339
Apriori算法优点:易编码实现缺点:在大数据集上可能较慢适用数据类型:数值型或者标称型算法过程:关联分析是一种在大规模数据集中寻找有意思的关系的任务,这里的有意思的关系有两种:频繁项集(frequent item sets)或关联规则(association rules)。支持度(support...
分类:
编程语言 时间:
2014-12-08 02:00:55
阅读次数:
334
Apriori算法关联分析与pyhon实现,关联规则里面最基本算法 Apriori算法...
分类:
编程语言 时间:
2014-11-05 23:10:41
阅读次数:
457
参考了许多资料加上个人理解,对十大算法进行如下分类:
?分类算法:C4.5,CART,Adaboost,NaiveBayes,KNN,SVM
?聚类算法:KMeans
?统计学习:EM
?关联分析:Apriori
?链接挖掘:PageRank...
分类:
编程语言 时间:
2014-11-03 11:32:18
阅读次数:
241
一东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!" 在此之前,提到关联分析,被引用最多的案例莫过于“啤酒与尿布”的故事,不过我想有了“猪肉炖粉条”这个案例后,啤酒与尿布要退出历史舞台了...
分类:
其他好文 时间:
2014-10-13 14:04:09
阅读次数:
288