本文主要介绍从FP-tree中提取频繁项集的算法。
更多请见:FP-Growth算法的介绍、FP_Growth算法python实现、FP-Growth算法python实现之 FP-tree的构造。
tree_miner.py代码:#coding=utf-8import tree_builder
import copyclass Tree_miner(object):
"""tree_mi...
分类:
编程语言 时间:
2015-07-04 09:42:12
阅读次数:
257
本文主要介绍FP-tree的构造算法。上接:FP-Growth算法python实现。
tree_builder.py代码:\color{aqua}{tree\_builder.py代码:}#coding=utf-8import tree_buildingclass Tree_builder(object):
"""tree_builder类。 作用:根据事务数据集进行数据准备及构造树....
分类:
编程语言 时间:
2015-07-04 09:41:01
阅读次数:
271
来源: http://community.jaspersoft.com/questions/847490/how-get-annual-growth-rate-crosstab
交叉表的每一列都是动态生成的,进行列间计算时需要动态引用,用Jasper脚本实现此类需求有一定难度,用集算器在数据准备阶段实现则相对简单,下面用例子来说明。
数据库表store存...
分类:
Web程序 时间:
2015-06-30 10:28:38
阅读次数:
154
1. sacrifice[英] [?sækrifais][美] [?sækr??fa?s] It's the company's policy to sacrifice short-term profits for the sake of long-term growth. 为了长期的发展而牺牲.....
分类:
其他好文 时间:
2015-06-29 19:17:26
阅读次数:
86
引言:在关联分析中,频繁项集的挖掘最常用到的就是Apriori算法。Apriori算法是一种先产生候选项集再检验是否频繁的“产生-测试”的方法。这种方法有种弊端:当数据集很大的时候,需要不断扫描数据集造成运行效率很低。
而FP-Growth算法就很好地解决了这个问题。它的思路是把数据集中的事务映射到一棵FP-Tree上面,再根据这棵树找出频繁项集。FP-Tree的构建过程只需要扫描两次数据集。...
分类:
编程语言 时间:
2015-06-28 12:49:56
阅读次数:
287
FP-Tree算法FPTree算法:在不生成候选项的情况下,完成Apriori算法的功能。FP-Tree:就是上面的那棵树,是把事务数据表中的各个事务数据项按照支持度排序后,把每个事务中的数据项按降序依次插入到一棵以NULL为根结点的树中,同时在每个结点处记录该结点出现的支持度。条件模式基:包含FP...
分类:
其他好文 时间:
2015-06-08 23:03:59
阅读次数:
175
题意:给一个天数N,求20*20方阵内细菌的变化情况。每次变化加上一个d[k],d数组有给定的16个数。k是某个格子它本身加上它上下左右的四个数。 简单模拟题。
分析:
#include
using namespace std;
int dir[4][2]={{-1,0},{1,0},{0,-1},{0,1}};
char den[]=".!X#";
int D[16];
int map...
分类:
其他好文 时间:
2015-06-07 09:43:15
阅读次数:
102
GrowthHacking?这是什么东西?在于许多创业者对话的过程中,我经常会看到他们这样的反应。如何你不懂GrowthHacking为何物,那么这篇文章非常适合你。在这篇文章中,诸葛会详细讲解GrowthHacking的概念,以及初创企业应该如何使用它,从而迅速的获得可持续的增长。Growthhackin..
分类:
其他好文 时间:
2015-05-26 19:05:08
阅读次数:
149
apriori算法的计算量太大,如果数据集略大一些,会比较慢,非常容易内存溢出。
我们可以算一下复杂度:假设样本数有N个,样本属性为M个,每个样本属性平均有K个nominal值。
1. 计算一项频繁集的时间复杂度是O(N*M*K)。
2. 假设具有最小支持度的频繁项是q个,根据它们则依次生成一项频繁集,二项频繁集,....,r项频繁集合,它们的元素数量分别是:c(q, 1), c(q...
分类:
编程语言 时间:
2015-05-24 21:55:40
阅读次数:
377
使用FP-growth算法来高效发现频繁项集前言你用过搜索引擎挥发现这样一个功能:输入一个单词或者单词的一部分,搜索引擎酒会自动补全查询词项,用户甚至实现都不知道搜索引擎推荐的东西是否存在,反而会去查找推荐词项,比如在百度输入“为什么”开始查询时,会出现诸如“为什么我有了变身器却不能变身奥特曼”之类滑稽的推荐结果,为了给出这些推荐查询慈祥,搜索引擎公司的研究人员使用了本文要介绍的一个算法...
分类:
编程语言 时间:
2015-05-21 15:39:35
阅读次数:
447