标签:ide 博客 无法 es2017 构造 size font 等等 tac
视频地址:https://pan.baidu.com/s/1b25yNG
机器学习比赛入门条件
1.过的去的code能力:Leetcode平台
leetcode平台可以帮助我们提高基本的算法实现能力,比如写一个冒泡排序方法,写出来的代码简洁高效
2.参与比赛:Data Fountain,Kaggle,biendata,Data castle
经常发布一些比赛,可以挑一些感兴趣的参加
3.关注公众号:阅读代码(高手的分享)或者论文; 推荐两个@Datacatsle@爱可可
4.朋友和圈子(大腿),各种群
机器学习比赛流程
这里推荐的网址其实是一个博主的博客:http://blog.csdn.net/sinat_22594309/article/details/68951145
在这个博主的博客中谈到了很多有关于机器学习的经验,加关注,以后可以读
1.特征工程这个地方就是数据分析能力,有些人其实就是可以能够很好的将数据变化得到的新的特征,比如说将数据从低维空间映射到核空间或者高维空间就可以将原本无法分类的数据分开,这就是很好的新特征,我们不能把所有的数据多怼到模型上,比如神经网络还是随机森林,因为这些数据有可能量很大,或者很复杂,模型很难直接吃下这些数据得到很好的结果,所以需要我们先进行特征工程这一步,构造出合适的特征喂给我们的模型,从而得到更好的结果,这个就是很考验想法的一个环节,每拿到一个题目,你能根据场景分析到什么样的idea可以很好的构造特征解决这个问题。有的人光是考规则怼就能拿到很好的数据竞赛成绩 比如天池比赛的规则大神 桑榆 天音。总之,特征工程是核心竞争力,有经验的人讲数据进行log对数变化啊这种
2.模型选用:大数据比赛中常用的模型就是各种nn模型(cnn,rnn),随机森林,boost,等等
3.模型融合,就是利用迭代,boosting的方式训练模型,这种就是真的在比赛中才会用到的技巧,一点都不学术
标签:ide 博客 无法 es2017 构造 size font 等等 tac
原文地址:http://www.cnblogs.com/huanjing/p/7648079.html