数学大神、统计学大神和数据挖掘推荐大神请关注。一、数学期望的理解 早些时候,法国有两个大数学家,一个叫做布莱士·帕斯卡,一个叫做费马。帕斯卡认识两个赌徒,这两个赌徒向他提出了一个问题。他们说,他俩下赌金之后,约定谁先赢满5局,谁就获得全部赌金。赌了半天,A赢了4局,B赢了3局,时间很晚了,他们都不....
分类:
编程语言 时间:
2015-01-08 21:34:42
阅读次数:
288
基于用户的协同过滤算法:找到和目标用户相似的用户集合找到这个集合中用户喜欢的但目标用户没有听过的物品#encoding: utf-8from Similarity import Personfrom Sort import select_sortfile=open('user_bookmark','...
分类:
编程语言 时间:
2014-12-27 22:57:09
阅读次数:
576
基于物品的协同过滤算法(ItemCF)是业界应用最多的算法,主要思想是利用用户之前有过的行为,给用户推荐和之前物品类似的物品。基于物品的协同过滤算法主要分为两步:1)计算物品之间的相似度。2)依据物品的相似度和用户的历史行为给用户生成推荐列表。第一步的关键点在于计算物品之间的相似度,这里并不採用基于...
分类:
编程语言 时间:
2014-12-26 09:32:42
阅读次数:
218
基于用户的协同过滤算法-参考《推荐系统实践》一书,作者:项亮 1 import random 2 import math 3 class UserBasedCF: 4 def __init__(self,datafile = None): 5 self.datafi...
分类:
编程语言 时间:
2014-12-11 12:02:25
阅读次数:
250
Mahout进阶课程,网盘下载:链接:http://pan.baidu.com/s/1dDGPM4x密码:pqdk网盘失效的话,请加QQ:3113533060课程大纲:第一周Mahout概述Mahout安装Mahout安装测试Mahout算法库介绍解析聚类算法解析分类算法协同过滤算法第二周聚类算法详解一、canopy算法简介1)mahout中canop..
分类:
其他好文 时间:
2014-12-09 15:49:26
阅读次数:
665
mahout入门指南之mahout单机版推荐算法
鄙人最近在研究mahout,网上找了一些入门资料来看,发现都整理的比较乱。折腾了一番,终于搞清楚了。为了让新手们较快入门,决定总结分享一下,写此入门指南。
mahout是什么?
mahout是一个机器学习库,里面实现了一些算法,比如推荐算法,聚类算法。
实现方式有单机内存版,也有分布式(hadoop和spark)。...
分类:
编程语言 时间:
2014-12-06 15:26:15
阅读次数:
368
来自:http://www.codesky.net/article/201206/171862.htmlmahout的taste框架是协同过滤算法的实现。它支持DataModel,如文件、数据库、NoSQL存储等,也支持Hadoop的MapReduce。这里主要分析的基于MR的实现。基于MR的CF实...
分类:
其他好文 时间:
2014-12-04 19:41:22
阅读次数:
179
在现实中广泛使用的推荐系统一般都是基于协同过滤算法的,这类算法通常都需要计算用户与用户或者项目与项目之间的相似度,对于数据量以及数据类型不 同的数据源,需要不同的相似度计算方法来提高推荐性能,在mahout提供了大量用于计算相似度的组件,这些组件分别实现了不同的相似度计算方法。下图用 于实现相似度计...
分类:
其他好文 时间:
2014-10-29 10:23:18
阅读次数:
222
前言用Mahout来构建推荐系统,是一件既简单又困难的事情。简单是因为Mahout完整地封装了“协同过滤”算法,并实现了并行化,提供非常简单的API接口;困难是因为我们不了解算法细节,很难去根据业务的场景进行算法配置和调优。本文将深入算法API去解释Mahout推荐算法底层的一些事。目录Mahout...
分类:
编程语言 时间:
2014-10-29 09:09:46
阅读次数:
331
好早的时候就打算写这篇文章,但是还是参加阿里大数据竞赛的第一季三月份的时候实验就完成了,硬生生是拖到了十一假期,自己也是醉了。。。找工作不是很顺利,希望写点东西回顾一下知识,然后再攒点人品吧,只能如此了。
一、问题背景
二、基于用户的协同过滤算法介绍
三、数据结构和实验过程设计
四、代码...
分类:
编程语言 时间:
2014-10-03 21:50:45
阅读次数:
281