码迷,mamicode.com
首页 > 移动开发 > 详细

machine learning比赛系列———2015阿里巴巴天池移动推荐

时间:2015-04-24 16:21:26      阅读:149      评论:0      收藏:0      [点我收藏+]

标签:andrew

本以为鄙人学完Andrew Ng的coursera的课还有UFLDL的教程,已经可以自居一隅了,没想到这次参加比赛着实让我长了见识。
下载完数据,一看,OMG!500多M(原谅我见识少)。刚开始啥也不懂,用Excel打开后删除掉其中两列,保存后就没再多看(后来才发现居然就剩30多m,坑爹的Excel)。然后就用这30多兆的数据进行处理,结果可想而知:技术分享

总结一下:

  • 不会SQL:导致在前期数据删选的时候碰壁
  • Matlab不是很熟悉:在导入数据的时候很吃力

思路

  • 首先linear regression预测出在19号会有购买行为的用户userName
  • 筛选出用户行为是3的商品itemName(本意是筛选出2,3,4的item,奈何机器内存不够)
  • 通过userName和itemName进行协同过滤

也不知道这样的思路是否正确,欢迎评论交流,QQ:379940325

machine learning比赛系列———2015阿里巴巴天池移动推荐

标签:andrew

原文地址:http://blog.csdn.net/meanme/article/details/45247157

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!