数据挖掘所挖掘的结果是面向全部的数据,而机器学习则是预测测试样本的检测结果。 1.挖掘知识类型:1.特征化2.数据区分3.关联分析4.分类5.聚类、孤立点分析、演变分析 2.互信息值:是信息论中一个有用的信息度量。它可以看出是一个信息量里包含另一个随机变量的信息量。 互信息值越大,就代表2个属性关联 ...
分类:
其他好文 时间:
2018-07-26 18:36:23
阅读次数:
546
Aprior算法 优点:易编码实现 缺点:在大数据集上可能较慢 适用数据类型:数值型或者标称型数据。 关联分析是一种在大规模数据集中寻找有趣关系的任务,这些关系可以有两种形式:频繁项集或者这关联规则。 频繁项集是经常出现在一块的物品集合,关联规则暗示两种物品之间可能存在很强的关系。 一个项集的支持度 ...
分类:
编程语言 时间:
2018-07-23 21:59:14
阅读次数:
408
一、主成分分析 二、因子分析法 三、聚类分析 四、最小二乘与多项式拟合 五、方差分析法 六、逼近理想点排序法 七、动态加权法 八、灰色关联分析法 九、灰色预测法 十、模糊综合评价法 十一、时间序列分析法 十二、蒙特卡洛仿真模型 十三、BP神经网络方法 十四、数据包络分析法 十五、多因素方差分析法(基 ...
分类:
编程语言 时间:
2018-07-21 14:30:16
阅读次数:
145
关联分析 是无监督讯息算法中的一种,Apriori主要用来做_关联分析_,_关联分析_可以有两种形式:频繁项集或者关联规则。举个例子:交易订单 | 序号 | 商品名称 | | | | | 1 | 书籍,电脑| | 2 | 杯子,手机,手机壳,盘子 | | 3 | 古筝,手机,手机壳,玻璃 | | 4 ...
分类:
编程语言 时间:
2018-07-20 01:11:21
阅读次数:
237
?1.关联分析概念 关联分析是从大量数据中发现项集之间有趣的关联和相关联系。 ? ?定义:1、事务:每一条交易称为一个事务,如上图包含5个事务。2、项:交易的每一个物品称为一个项,例如豆奶,啤酒等。 3、项集:包含零个或多个项的集合叫做项集,例如{尿布,啤酒}。4、k?项集:包含k个项的项集叫做k- ...
分类:
编程语言 时间:
2018-07-19 13:32:20
阅读次数:
177
目录 1. 关联分析 2. Apriori原理 3. 使用Apriori算法来发现频繁集 4. 使用FP-growth算法来高效发现频繁项集 5. 示例:从新闻网站点击流中挖掘新闻报道 扩展阅读 目录 1. 关联分析 2. Apriori原理 3. 使用Apriori算法来发现频繁集 4. 使用FP ...
分类:
编程语言 时间:
2018-07-16 12:25:36
阅读次数:
201
一、分析图合并原理 选择view->merge graphs,弹出如图1所示对话框 图1(设置合并图) 1、选择要合并的图。选择一个要与当前活动图合并的图,注意这里只能选择X轴度量单位相同的图。 2、选择合并类型。 1)叠加:查看共用同一X轴的两个图的内容。合并图左侧的Y轴显示当前图的Y轴值,右边的 ...
分类:
其他好文 时间:
2018-05-07 15:29:15
阅读次数:
231
aside元素用来表示当前页面或文章的附属信息部分,它可以包含与当前页面或主要内容相关的引用、侧边栏、广告、导航条,以及其他类似的有别于主要内容的部分。 aside元素主要有以下两种使用方法: 1、包含在aside元素中作为主要内容的附属信息部分,其中内容可以是与当前文章有关的参考资料、名词解释等。 ...
分类:
其他好文 时间:
2018-04-30 16:43:19
阅读次数:
159
三.FP-tree算法 下面介绍一种使用了与Apriori完全不同的方法来发现频繁项集的算法FP-tree。FP-tree算法在过程中没有像Apriori一样产生候选集,而是采用了更为紧凑的数据结构组织tree, 再直接从这个结构中提取频繁项集。FP-tree算法的过程为: 首先对事务中的每个项计算 ...
分类:
编程语言 时间:
2018-04-23 22:39:46
阅读次数:
242
一、前述 关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析 (market basket analysis)。例如,购买鞋的顾客,有10%的可能也会买袜子,60%的买面包的顾客,也会买牛奶。这其中最有名的例子就是"尿布和啤酒"的故事了。 二、相关概念 关联分析:在大规模数据集中寻 ...
分类:
编程语言 时间:
2018-04-07 20:05:41
阅读次数:
218