第一次参加,天池大数据竞赛(血糖预测),初赛排名1%。因为自己对python不熟悉,所以记录一下在比赛中用到的一些python方法的使用(比较基础细节,大佬绕道): 1.数据初探 使用上面两行代码,可以初步的看到整个数据的分布、缺失等情况 2.数据中存在性别是字符串表示的,使用map方法,将他数字化 ...
分类:
编程语言 时间:
2018-01-30 19:44:30
阅读次数:
293
Jeremy Howard 在业界可谓大名鼎鼎。他是大数据竞赛平台 Kaggle 的前主席和首席科学家。他本人还是 Kaggle 的冠军选手。他是美国奇点大学(Singularity University)最年轻的教职工。曾于 2014 年,作为全球青年领袖,在达沃斯论坛上发表主题演讲。他在 TED ...
分类:
其他好文 时间:
2017-11-21 17:05:26
阅读次数:
186
好早的时候就打算写这篇文章,可是还是參加阿里大数据竞赛的第一季三月份的时候实验就完毕了。硬生生是拖到了十一假期。自己也是醉了。。。找工作不是非常顺利,希望写点东西回想一下知识。然后再攒点人品吧,仅仅能如此了。 一、问题背景 二、基于用户的协同过滤算法介绍 三、数据结构和实验过程设计 四、代码 一、问 ...
分类:
编程语言 时间:
2017-06-05 22:10:06
阅读次数:
312
1.Kaggle 基本介绍 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台。在 Kaggle 上,企业或者研究机构发布商业和科研难题,悬赏吸引全球的数据科学家,通过众包的方式解决建模问题。而参赛者可以接触到丰富的真实数据,解决实际问题,角 ...
分类:
其他好文 时间:
2017-05-14 18:08:56
阅读次数:
237
想从事数据科学家的自我修炼(浪叫兽的书单)一年之内从零基础入门(以不抱大腿的姿势)拿下数据竞赛 一等奖 ,二等奖,三等奖携程赛的初练书单 在科赛网站上,我第一次报名参加了比赛是,酒店未来30天产量预测,当时参加比赛是16年的7月中旬了。距今日的17年5月中旬,不到一年的时间,在科赛网,同样是在携程的 ...
分类:
其他好文 时间:
2017-05-13 14:26:32
阅读次数:
653
xgboost的全称是eXtreme Gradient Boosting,现在已经风靡Kaggle、天池、DataCastle、Kesci等国内外数据竞赛平台,是比赛夺冠的必备大杀器!如果把数据竞赛比作金庸笔下的武林,那么XGBoost可谓屠龙刀,号令天下,莫敢不从! 于是,在学习了机器学习知识良久 ...
历时两个月的比赛终于结束了,最终以第32名的成绩告终,在此和大家分享下解决问题的思路。
从初赛到复赛,有走过弯路,也有突然灵光一现的时刻。一路走来,对数据各种把玩,分析了各种可能的情况,尽可...
分类:
其他好文 时间:
2016-11-29 23:20:48
阅读次数:
274
Kaggle大数据竞赛平台入门 大数据竞赛平台,国内主要是天池大数据竞赛和DataCastle,国外主要就是Kaggle.Kaggle是一个数据挖掘的竞赛平台,网站为:https://www.kaggle.com/.很多的机构,企业将问题,描述,期望发布在Kaggle上,以竞赛的方式向广大的数据科学 ...
分类:
其他好文 时间:
2016-11-14 14:36:08
阅读次数:
276
Reference: http://blog.csdn.net/witnessai1/article/details/52612012 Kaggle是一个数据分析的竞赛平台,网址:https://www.kaggle.com/ 企业或者研究者可以将数据、问题描述、期望的指标发布到Kaggle上,以竞 ...
分类:
其他好文 时间:
2016-09-29 07:40:01
阅读次数:
163
2015年 参加天池大数据竞赛 为了建立模型,打算基于matlab使用Random Forest Algorithm的工具包 该工具包我在此分享给大家,http://yunpan.cn/cVXsjQvh8ARcx 访问密码 30a3 该工具包导入的数据格式就是我如下所说的封装方式,因此,在使用该算法 ...
分类:
其他好文 时间:
2016-08-16 21:43:08
阅读次数:
856