在研究文本推荐算法时,需要挖掘关键字之间的规则,其中比较重要的一步是构建关键字的集合,即需要求取一个集合的所有子集。因此本文根据需求,采用二叉树递归、位图和集合3种方式实现该算法,以期对后续算法研究提供帮助。
分类:
其他好文 时间:
2015-11-09 20:37:13
阅读次数:
318
机器学习算法汇总 1. 前言 通过将工作中用到的机器学习算法归纳汇总,方便以后查找,快速应用。 2. 推荐算法 交叉最小方差 算法名字 交叉最小方差, Alternating Least Squares, ALS 算法描述 Spark上的交替性最小...
分类:
编程语言 时间:
2015-10-28 15:51:56
阅读次数:
351
这里我想给大家介绍另外一种推荐系统,这种算法叫做潜在因子(Latent Factor)算法。这种算法是在NetFlix(没错,就是用大数据捧火《纸牌屋》的那家公司)的推荐算法竞赛中获奖的算法,最早被应用于电影推荐中。这种算法在实际应用中比现在排名第一的@邰原朗所介绍的算法误差(RMSE)会小不少.....
分类:
其他好文 时间:
2015-10-15 18:16:11
阅读次数:
293
本文将按照作者学习的顺序,对推荐算法进行一个综述性的介绍,可能会有些跳跃性。一则供自己后续不时翻阅,二则分享给读者。传播知识是一件很快乐的事情。 ? ? 1. 基于相似度的方法(协同过滤) ? ? ...
分类:
编程语言 时间:
2015-10-08 16:42:27
阅读次数:
256
【这里只讲快速入门——即破题,正负样本不平衡、特征数量等问题就自己多看论文或者其他资料吧~~如果还有数据挖掘相关基础知识不了解的,建议看看《数据挖掘导论》】【以下是理解错误案例】:错误的根本原因是不能保证训练集的构建逻辑与赛题目标保持一致,不能保证训练集和测试集的构建逻辑保持一致,不能保证离线评测的...
分类:
移动开发 时间:
2015-09-09 09:37:44
阅读次数:
238
之前有幸在MOOC学院抽中小象学院hadoop体验课。这是小象学院hadoop2.X的笔记由于平时对数据挖掘做的比较多,所以优先看Mahout方向视频。Mahout有很好的扩展性与容错性(基于HDFS&MapReduce开发),实现了大部分常用的数据挖掘算法(聚类、分类、推荐算法)不过数据挖掘调参和...
分类:
其他好文 时间:
2015-08-29 00:45:12
阅读次数:
211
推荐系统(RecSys)作为电子商务中一个很火的应用,主要是为了帮助用户发现可能感兴趣的东西,这种就叫做个性化推荐系统;而广告商还可以利用结果将内容投放给可能会对它们感兴趣的用户,这就成了个性化广告。比较著名的推荐系统有亚马逊,被RWW(读写网)称为“推荐系统之王”,你从亚马逊买了一本书以后,会发现它会经常向你的邮箱发一些相关的书籍,这个有时比较恼人,呵呵;此外还要电影和视频网站,像YouTube...
分类:
其他好文 时间:
2015-08-19 16:56:14
阅读次数:
281
此项目是在《Hadoop Web项目--Friend Find系统基础》之上整理Mahout0.10版本中MR程序的调用测试而成,重点演示如何调用Mahout0.10的MR算法、如何把MR算法嵌入到Web项目中,附带数据生成及数据查看、MR 任务监控等功能。里面含有了常用工具类、聚类算法、分推荐算法等的MR调用mahout命令以及其对应的实现类。...
分类:
编程语言 时间:
2015-08-18 19:24:57
阅读次数:
333
最近在研究推荐算法方面的知识,对SVD似懂非懂,在ChinaUnix论坛上发现一个很好的解释SVD的例子,所以赶紧贴了出来,和大家分享:http://blog.chinaunix.net/uid-20761674-id-4040274.html原文:We recommend a singular v...
分类:
其他好文 时间:
2015-08-16 19:33:37
阅读次数:
197