码迷,mamicode.com
首页 > 其他好文 > 详细

游戏玩家付费金额预测

时间:2018-09-03 12:03:40      阅读:765      评论:0      收藏:0      [点我收藏+]

标签:时长   之间   存在   分类   学习   idt   机器学习   特征选择   回归   

大纲:

赛题描述==》定位机器学习问题

数据分析==》特征选择==》算法选择==》参数优化

先分类,后回归,最后将每个回归模型用不同的算法进行模型融合。

流程:

熟悉数据:

前105个特征是关于游戏属性,后三个特征分别是平均在线时长,7日付费金额,7日付费次数,需要预测的是45日付费金额。

筛选特征:

 技术分享图片

分类标准:

技术分享图片

四个特征值,一个预测值。

 

 

总结:

1.关于非均衡数据的处理方法,解决方法:欠采样、过采样、代价函数权值。若存在极度偏斜的数据时,就如同99:1,那么就可以归并为异常检测。

2.算法的选择及优化所带来的成绩提升是有限的(5~10分之间),而正真影响到成绩的层次是特征的选择及处理,就是所谓的特征工程。当然我这场比赛打下来,80%的时间是在做特征工程。

游戏玩家付费金额预测

标签:时长   之间   存在   分类   学习   idt   机器学习   特征选择   回归   

原文地址:https://www.cnblogs.com/zenan/p/9577168.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!