使用MATLAB尝试了随机梯度下降的矩阵分解方法,实现了一个比较简单的推荐系统的原理。常用推荐系统的方法有协同过滤, 基于物品内容过滤等等。这次是用的矩阵分解模型属于协同过滤的一种方法,大致原理是通过一定数量的因子来描述各个用户的喜好和各个物品的属性。通过随机梯度下降法分解后得到两个矩阵,一个是用....
分类:
其他好文 时间:
2014-06-21 07:17:05
阅读次数:
346
spark1.0.0下使用scala实现机器学习算法,包括分类、回归、聚类、协同过滤以及降维等。
分类:
其他好文 时间:
2014-06-18 15:25:15
阅读次数:
346
Octave/matlab的常用知识之矩阵和向量
之前一段时间在coursera看了Andrew ng的机器学习的课程,感觉还不错,算是入门了。这次打算以该课程的作业为主线,对机器学习基本知识做一下总结。
小弟才学疏浅,如有错误,敬请指导。
Andrew的课程选了Octave/matlab为编程语言。他选择这个估计更多是考虑大众性,这门语言容易入门。...
分类:
其他好文 时间:
2014-06-18 07:41:14
阅读次数:
258
OctaveMatlab的常用知识之画图
之前一段时间在coursera看了Andrew ng的机器学习的课程,感觉还不错,算是入门了。这次打算以该课程的作业为主线,对机器学习基本知识做一下总结。小弟才学疏浅,如有错误,敬请指导。
OctaveMatlab的常用知识之画图
看几个例子即可。...
分类:
其他好文 时间:
2014-06-18 06:46:50
阅读次数:
254
本文是读完 Jeffrey Dean, Greg S. Corrado 等人的文章 Large Scale Distributed Deep Networks (2012) 后的一则读书笔记,重点介绍在 Google 的软件框架 DistBelief 下设计的一种用来训练大规模深度神经网络的随机梯度下降法 — Downpour SGD,该方法通过分布式地部署多个模型副本和一个“参数服务器”,同时实现了模型并行和数据并行,且对机器失效问题具有很好的容错性。结合 Adagrad 自适应学习率使用,对非凸优化问题...
分类:
其他好文 时间:
2014-06-18 00:55:39
阅读次数:
433
今天按照《机器学习实战》学习k-邻近算法,输入KNN.classify0([0,0],group,labels,3)的时候总是报如下的错误:Traceback(mostrecentcalllast):File"<pyshell#75>",line1,in<module>KNN.classify0([0,0],group,labels,3)File"KNN.py",line16,inclassify0diffMat=til..
分类:
其他好文 时间:
2014-06-17 17:05:39
阅读次数:
235
1、介绍 ?决策树(decision tree)是一种有监督的机器学习算法,是一个分类算法。在给定训练集的条件下,生成一个自顶而下的决策树,树的根为起点,树的叶子为样本的分类,从根到叶子的路径就是一个样本进行分类的过程。 ?下图为一个决策树的例子,见http://zh.wikipedia.org/w...
分类:
其他好文 时间:
2014-06-17 13:17:44
阅读次数:
281
什么是回归?假设现在有些数据点,我用直线对这些点进行拟合(该线叫做最佳拟合直线),这个拟合的过程就叫做回归。Logistic回归?这里,Logistic回归进行分类的主要思想:根据现有数据对分类的边界线建立回归公式,以此边界线进行分类。这里的回归指的是最佳拟合,就是要找到边界线的回归公式的最佳拟合的...
分类:
其他好文 时间:
2014-06-17 12:52:30
阅读次数:
648
(转载请注明出处:http://blog.csdn.net/buptgshengod)1.背景 这是博主第一次大数据实战的经历,之前都是自己写一些算法然后测试很小的数量级。这次是真正接触到TB集的数据,而且完全是在云端处理。下面就把这次的经历简单分享一下。首先简单介绍一下这次比赛的环境吧:1.云:采用的是阿里云2.数据:从四月十五号到八月十五号期间,用户两千多万的购买行为(包括时间,购买、收...
分类:
其他好文 时间:
2014-06-16 14:21:39
阅读次数:
351