码迷,mamicode.com
首页 > 其他好文 > 详细

数据过滤

时间:2017-04-15 01:18:49      阅读:156      评论:0      收藏:0      [点我收藏+]

标签:机制   影响   序列   padding   播放   .com   操作   忘记   图结构   

 

w

递归的艺术 - 深度递归网络在序列式推荐的应用  https://mp.weixin.qq.com/s/nzEnluS4YCEy95Lqv7tTKQ

 

   在测试中,我们收集了QQ音乐最近的电台听歌记录,共约8千万条听歌序列,并对数据做了必要的预处理操作,主要包括下面两点:

  1. 去掉了点击序列小于5首,大于50首的听歌数据,去掉序列过少是为了防止误点击,去掉过长的听歌序列是为了防止用户忘记关掉播放器。

  2. 对于全部是5秒内跳过的听歌序列也同样去掉,这样可以有效防止不正当的负操作过多对模型训练产生的影响。

    代码采用Theano深度学习框架来实现,Theano也是当前对RNN支持最好的深度学习框架之一,它的scan机制使得RNN (包括LSTM, GRU) 的实现代码非常优雅。下图是核心递归代码生成的图结构:

 

数据过滤

标签:机制   影响   序列   padding   播放   .com   操作   忘记   图结构   

原文地址:http://www.cnblogs.com/yuanjiangw/p/6711528.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!