赛题地址:http://tianchi.aliyun.com/competition/information.htm?raceId=1 登录就可以下载数据 从4月到7月,学习了非常多也收获了非常多 题目就不多说了。一句话表达就是依据过去一个月的行为预測14年12月19号的购买情况。 看题目貌似推荐算 ...
分类:
移动开发 时间:
2017-05-12 00:09:35
阅读次数:
288
【这里只讲快速入门——即破题,正负样本不平衡、特征数量等问题就自己多看论文或者其他资料吧~~如果还有数据挖掘相关基础知识不了解的,建议看看《数据挖掘导论》】【以下是理解错误案例】:错误的根本原因是不能保证训练集的构建逻辑与赛题目标保持一致,不能保证训练集和测试集的构建逻辑保持一致,不能保证离线评测的...
分类:
移动开发 时间:
2015-09-09 09:37:44
阅读次数:
238
赛题地址:http://tianchi.aliyun.com/competition/information.htm?raceId=1
登录即可下载数据
从4月到7月,学习了很多也收获了很多
题目就不多说了,一句话表达就是根据过去一个月的行为预测14年12月19号的购买情况。
看题目貌似推荐算法,自然就有队伍想到用协同过滤什么的,当然效果不好。
首先是特征的问题,然后是这是基于行...
分类:
移动开发 时间:
2015-07-29 01:07:16
阅读次数:
769
想用机器学习的方法,那么思路其实也很明确,问题是那一天用户是买还是不买,那么可以看成是二分法。通过用户行为方式来判断是否会购买。就是把用户行为等抽象成特征向量得到训练集,扔进机器学习算法训练出一个模型,然后用测试集预测出结果。虽然机器学习的算法有不少,而且需要不断的调整参数和优化,但是我认为特征向量的选取才是最关键的,很显然我们到最后也没搞好~~~...
分类:
移动开发 时间:
2015-05-17 12:20:50
阅读次数:
155
推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。
随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用户很难从如此多的信息流中找到对自己有价值的信息。...
分类:
移动开发 时间:
2015-05-16 07:56:39
阅读次数:
1430
关于2015阿里移动推荐算法大赛的总结,第一部分是概括,第二部分是关于推荐算法,第三部分是关于机器学习的预测...
分类:
移动开发 时间:
2015-05-14 10:08:59
阅读次数:
804