预测主要包括分类 - 将样本划分到几个预定义类之一,回归 - 将皇冠代理网样本映射到一个真实值预测变量上;描述主要包括聚类 - 将样本划分为不同类(无预定义类),关联规则发现 - 发现数据集中不同特征的相关性。本系列其他文章将会分别对这些工作深入进行讲解,如果读者是第一次接触这些概念请不要纠结。 品 ...
分类:
其他好文 时间:
2016-07-30 16:37:58
阅读次数:
554
持续学习完善中~ 分类模型的构造方法有:决策树,关联规则,贝叶斯,神经网络,规则学习,k-临近法,遗传算法,粗糙集以及模糊逻辑技术。 朴素贝叶斯 利用概率统计知识进行分类的算法 最大化后验概率P(Ci|X)可转化为最大化先验概率P(X|Ci)P(Ci) 前提是各属性之间互相独立 逻辑回归 决策树SV ...
分类:
编程语言 时间:
2016-07-25 13:02:13
阅读次数:
440
本人看过的关联规则博文,很少有清晰的把关联规则的算法说很明白的,希望读者读完本文可以有新的收获。本文是在默认读者有相关机器学习算法基础的,总结和提升对关联规则代码实现的理解,并介绍相关案例。语言:python 一 引言 关联规则起初是在购物篮分析中发现的,沃尔玛超市在美国某地区啤酒和尿布放在一起卖, ...
分类:
其他好文 时间:
2016-06-24 22:14:04
阅读次数:
479
一、前言 在学习The Apriori algorithm算法时,参考了多篇博客和一篇论文,尽管这些都是很优秀的文章,但是并没有一篇文章详解了算法的整个流程,故整理多篇文章,并加入自己的一些注解,有了下面的文章。大部分应该是copy各篇博客和翻译了论文的重要知识。 关联规则的目的在于在一个数据集中找 ...
分类:
编程语言 时间:
2016-06-09 20:56:07
阅读次数:
401
推荐系统的分类
常见评测标准
http://blog.csdn.net/u011263983/article/details/51544495
相似度
1)同现相似度
2)欧氏距离相似度
3)余弦相似度
4)秩相关系数相似度
5)曼哈顿距离相似度
6)对数似然相似度
常见推荐系统算法
关联规则;
Apriori...
分类:
其他好文 时间:
2016-06-02 14:35:55
阅读次数:
2915
APRIORI Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。而且算法已经被广泛的应用到商业、网络安全等各个领域。 Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来 ...
分类:
编程语言 时间:
2016-05-11 23:49:57
阅读次数:
275
关联规则ASSOCIATION RULE
文本中应用:单词间的并发关系
特点:不考虑序列顺序,而序列挖掘考虑顺序
基本概念:
一个关联规则是一个如下形式的蕴含关系:
x->y,且无交集
支持计数
衡量关联规则强度的指标:
支持度:如果支持度太小,表明该规则很可能只是偶然发生,覆盖的食物很少无价值。
置信度:可预测度,如果置信度太低,表示很难可靠的做出该规则推断。
目标找出所...
分类:
Web程序 时间:
2016-05-07 10:51:25
阅读次数:
326
前面介绍了关联规则1 不考虑用户购买的items之间的时序关系,但在一些情况下用户购买item是有严格的次序关系了,比如在某些休闲游戏中,用户购买了道具A才能购买道具B,且道具A和B只能购买一次,也就是说购买了道具A是购买道具B的充分条件,如果购买道具A的用户通常会购买道具A,在不考虑时序关系的时候 ...
分类:
编程语言 时间:
2016-04-27 00:13:05
阅读次数:
739
本文介绍的是关联规则,分为两部分:第一部分是 不考虑用户购买的items之间严格的时序关系,每个用户有一个“购物篮”,查找其中的关联规则。第二部分 考虑items之间的严格的时序关系来分析用户道具购买路径以及关联规则挖掘。此文为第一部分的讲解。(本文所需的代码和数据集可以在这里下载。) 关联规则最常 ...
分类:
编程语言 时间:
2016-04-26 23:43:39
阅读次数:
1176
数据挖掘:关联规则挖掘 关联规则挖掘:Apriori算法 提高Apriori的效率 基于散列的算法基于FP tree的算法 ...
分类:
编程语言 时间:
2016-04-23 22:38:41
阅读次数:
563