码迷,mamicode.com
首页 > 其他好文 > 详细

kaggle首秀之intel癌症预测(续篇)

时间:2017-07-11 23:18:10      阅读:247      评论:0      收藏:0      [点我收藏+]

标签:一段   文章   分类   样本   lazy   gre   视频   type   from   

之前写了这篇文章。现在把他搬到知乎live上了。书非借不能读也,因此搞了点小费用,如果你觉得贵,加我微信我给你发红包返回给你。

最近的空余时间拿去搞kaggle了, 好久没更新文章了。今天写写kaggle首秀的一段baseline吧。

技术分享

这个题目是intel的癌症预测。我之前本来是想打谷歌的视频多标签分类的,但是那个数据量大,需要用谷歌云,然后呢,需要用双币信用卡注册,结果我的双币信用卡没有开通国外账户,考虑到安全性(去年我一个同事的信用卡直接在澳大利亚被盗刷),就换成了这个比赛了。

   这个比赛很简单,就是图片分类,根据医院的癌症检测图片,将其分成1-2-3类。

好像很简单?我一开始也是这样认为的。结果发现有很多坑。我有好几次提交都是倒数。完全找不到北。究其原因:这个数据量其实比较小,然后就是图片样本空间较丰富,还有就是三个种类有时候分类的界限其实没那么清晰的。

弱弱的我卯足了劲玩了一个晚上的花招,周末开始搞的,今天提交了一个版本。排到了第18名,算是一个baseline吧。目前好像有几百个队伍的样子。

附上排行榜链接。

https://www.kaggle.com/c/intel-mobileodt-cervical-cancer-screening/leaderboard

一个截图:

技术分享

网站上也说从1.005提升到0.75813是一个great job。姑且算作一个baseline吧。

知乎的链接

https://www.zhihu.com/lives/868157097320280064

kaggle首秀之intel癌症预测(续篇)

标签:一段   文章   分类   样本   lazy   gre   视频   type   from   

原文地址:http://www.cnblogs.com/whu-zeng/p/7152524.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!