前言 在企业安全建设专题中偶尔有次提到算法的应用,不少同学想深入了解这块,所以我专门开了一个子专题用于介绍安全领域经常用到的机器学习模型,从入门级别的SVM、贝叶斯等到HMM、神经网络和深度学习(其实深度学习可以认为就是神经网络的加强版)。 关联规则挖掘 关联规则挖掘通常是无监督学习,通过分析数据集 ...
分类:
编程语言 时间:
2017-05-15 10:04:14
阅读次数:
319
前言 在企业安全建设专题中偶尔有次提到算法的应用,不少同学想深入了解这块,所以我专门开了一个子专题用于介绍安全领域经常用到的机器学习模型,从入门级别的SVM、贝叶斯等到HMM、神经网络和深度学习(其实深度学习可以认为就是神经网络的加强版)。 关联规则挖掘 关联规则挖掘通常是无监督学习,通过分析数据集 ...
分类:
编程语言 时间:
2017-05-15 00:34:11
阅读次数:
209
Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于我们做一些决策。比如在常见的超市购物数据集,或者电商的网购数据集中,如果我们找到了频繁出现的数据集,那么对于超市,我们可以优化产品的位置摆放,对于电商,我们可以优化商品所在的仓库位置 ...
分类:
编程语言 时间:
2017-04-07 18:21:23
阅读次数:
322
在Apriori算法原理总结中,我们对Apriori算法的原理做了总结。作为一个挖掘频繁项集的算法,Apriori算法需要多次扫描数据,I/O是很大的瓶颈。为了解决这个问题,FP Tree算法(也称FP Growth算法)采用了一些技巧,无论多少数据,只需要扫描两次数据集,因此提高了算法运行的效率。 ...
分类:
编程语言 时间:
2017-04-07 18:19:38
阅读次数:
284
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里我们将为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 ...
分类:
编程语言 时间:
2017-02-06 15:47:14
阅读次数:
253
基本概念对于A→BA\rightarrow B
支持度(support):P(A∩B)P(A ∩ B),既有A又有B的概率
置信度(Confidence Strength):conf(A→B)=sup...
分类:
编程语言 时间:
2017-01-28 11:30:03
阅读次数:
397
在Apriori算法原理总结中,我们对Apriori算法的原理做了总结。作为一个挖掘频繁项集的算法,Apriori算法需要多次扫描数据,I/O是很大的瓶颈。为了解决这个问题,FP Tree算法(也称FP Growth算法)采用了一些技巧,无论多少数据,只需要扫描两次数据集,因此提高了算法运行的效率。 ...
分类:
编程语言 时间:
2017-01-19 22:56:00
阅读次数:
260
想必大家都听过数据挖掘领域那个经典的故事 - "啤酒与尿布" 的故事。 那么,具体是怎么从海量销售信息中挖掘出啤酒和尿布之间的关系呢? ...
分类:
编程语言 时间:
2017-01-19 12:45:21
阅读次数:
314
http://www.cnblogs.com/zhangchaoyang/p/4385011.html ...
分类:
其他好文 时间:
2016-12-23 13:32:58
阅读次数:
197
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, N ...
分类:
编程语言 时间:
2016-12-20 21:00:13
阅读次数:
248