码迷,mamicode.com
首页 > 其他好文 > 详细

从零开始机器学习比赛经验(bird分享)

时间:2017-10-10 23:16:55      阅读:224      评论:0      收藏:0      [点我收藏+]

标签:ide   博客   无法   es2017   构造   size   font   等等   tac   

视频地址:https://pan.baidu.com/s/1b25yNG

机器学习比赛入门条件

1.过的去的code能力:Leetcode平台

leetcode平台可以帮助我们提高基本的算法实现能力,比如写一个冒泡排序方法,写出来的代码简洁高效

2.参与比赛:Data Fountain,Kaggle,biendata,Data castle

经常发布一些比赛,可以挑一些感兴趣的参加

3.关注公众号:阅读代码(高手的分享)或者论文; 推荐两个@Datacatsle@爱可可

4.朋友和圈子(大腿),各种群

机器学习比赛流程

技术分享

这里推荐的网址其实是一个博主的博客:http://blog.csdn.net/sinat_22594309/article/details/68951145

在这个博主的博客中谈到了很多有关于机器学习的经验,加关注,以后可以读

1.特征工程这个地方就是数据分析能力,有些人其实就是可以能够很好的将数据变化得到的新的特征,比如说将数据从低维空间映射到核空间或者高维空间就可以将原本无法分类的数据分开,这就是很好的新特征,我们不能把所有的数据多怼到模型上,比如神经网络还是随机森林,因为这些数据有可能量很大,或者很复杂,模型很难直接吃下这些数据得到很好的结果,所以需要我们先进行特征工程这一步,构造出合适的特征喂给我们的模型,从而得到更好的结果,这个就是很考验想法的一个环节,每拿到一个题目,你能根据场景分析到什么样的idea可以很好的构造特征解决这个问题。有的人光是考规则怼就能拿到很好的数据竞赛成绩 比如天池比赛的规则大神 桑榆 天音。总之,特征工程是核心竞争力,有经验的人讲数据进行log对数变化啊这种

2.模型选用:大数据比赛中常用的模型就是各种nn模型(cnn,rnn),随机森林,boost,等等

3.模型融合,就是利用迭代,boosting的方式训练模型,这种就是真的在比赛中才会用到的技巧,一点都不学术

技术分享

 

从零开始机器学习比赛经验(bird分享)

标签:ide   博客   无法   es2017   构造   size   font   等等   tac   

原文地址:http://www.cnblogs.com/huanjing/p/7648079.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!