系统的深入学习的话避免不了阅读相关的papers 论文:ACM的RecSys,KDD,WWW,SIGIR等会议上都有相关的论文 书籍 推荐系统实践 (豆瓣) 推荐系统 (豆瓣) 机器学习实战 (豆瓣) 统计学习方法 (豆瓣) Recommender Systems Handbook (豆瓣)等 视频... ...
分类:
编程语言 时间:
2016-03-28 15:35:16
阅读次数:
447
参考资料:《机器学习实战》 Peter Harrington ...
分类:
其他好文 时间:
2016-03-24 13:07:09
阅读次数:
165
最近重新看了《机器学习实战》第八章:预测数值型数据:回归。发现了一个以前没有重视的问题,规则化(regularization),通过网上各种查找资料,发现规则化对数据的特征选择,防止回归模型过拟合都有非常大的帮助。 简单的讲,规则化就是给损失函数(cost function)多项式再加上一项,使得训
分类:
其他好文 时间:
2016-03-15 00:36:58
阅读次数:
215
听朋友说machine Learning 很牛,特地买了本《机器学习实战》,了解机器学习,顺便学习python。。 第一个算法是kNN,很容易理解,简单实用,但是存储和计算的复杂度有点高,而且无法给出数据的内在含义。 书中介绍的两个实例,让我感觉机器学习确实很实用,以下是从《机器学习实战》中整理摘抄
分类:
编程语言 时间:
2016-03-01 22:20:58
阅读次数:
376
Logistic回归的一般过程 1.收集数据:采用任意方法收集 2.准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则最佳 3.分析数据:采用任意方法对数据进行分析 4.训练算法:大部分时间将用于训练,训练的目的是为了找到最佳的分类回归系数 5.测试算法:一旦训练步骤完
分类:
其他好文 时间:
2016-02-14 21:00:48
阅读次数:
1050
4.1 基于贝叶斯决策理论的分类方法 朴素贝叶斯 优点:在数据较少的情况下仍然有效,可以处理多类别问题 缺点:对于输入数据的准备方式较为敏感 适用数据类型:标称型数据 贝叶斯决策理论的核心思想:选择具有最高概率的决策。 4.2 条件概率 4.3 使用条件概率来分类 4.4 使用朴素贝叶斯进行文档分类
分类:
其他好文 时间:
2016-02-06 18:27:09
阅读次数:
323
huojfer 一个简单的验证码破解器,一开始为hustoj(校OJ)而写。 https://github.com/Darksun2010/huojfer MLlearning 《机器学习实战》一书的lua代码实现。 https://github.com/Darksun2010/MLlearning
分类:
其他好文 时间:
2016-02-05 22:20:02
阅读次数:
171
利用k-近邻分类器实现手写识别系统,训练数据集大约2000个样本,每个数字大约有200个样本,每个样本保存在一个txt文件中,手写体图像本身是32X32的二值图像,如下图所示:
首先,我们需要将图像格式化处理为一个向量,把一个32X32的二进制图像矩阵通过img2vector()函数转换为1X1024的向量:
def img2vector(filename):
retu...
分类:
编程语言 时间:
2016-01-17 14:57:43
阅读次数:
235
一、案例背景
我的朋友海伦一直使用在线约会网站寻找合适自己的约会对象。尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人。经过一番总结,她发现曾交往过三种类型的人:
(1)不喜欢的人;
(2)魅力一般的人;
(3)极具魅力的人;
尽管发现了上述规律,但海伦依然无法将约会网站推荐的匹配对象归入恰当的分类,她觉得可以在周一到周五约会那些魅力一般的人,而周末则更喜欢与那些极具魅力的人为伴...
分类:
编程语言 时间:
2016-01-17 13:38:35
阅读次数:
329
SVD(Singular Value Decomposition)奇异值分解,可以用来简化数据,去除噪声,提高算法的结果。
一、SVD与推荐系统
下图由餐馆的菜和品菜师对这些菜的意见组成,品菜师可以采用1到5之间的任意一个整数来对菜评级,如果品菜师没有尝过某道菜,则评级为0
建立一个新文件svdRec.py并加入如下代码:
def loadExData():
return[...
分类:
其他好文 时间:
2016-01-11 12:14:50
阅读次数:
1033