码迷,mamicode.com
首页 > 其他好文 > 详细

大数据黑客马拉松(Big Data Hackathon)赛后小结

时间:2015-08-18 22:38:39      阅读:189      评论:0      收藏:0      [点我收藏+]

标签:

上周末参加了IBM Analytics举办的“大数据黑客马拉松(Big Data Hackathon)北京站”比赛,4个人组队拿到了第一名,非常的开心,也非常的不容易,我们四个wesor像共事了很久一样,各司其职配合默契,拿下了最后的锦标。第一天9点到晚上11点多,本想熬夜可是受限于主办方场地,第二天9点到下午三点,连吃饭都端着盘子对着电脑。这两天累的一直缓解不过来,睡觉都觉得累的睡不着,但是确实学到了很多的东西,从比赛中,从队友身上……

就像博士说的,要说服别人觉得自己的工作非常重要。这句话之前从别的地方看到过,当时觉得不以为然,现在越发觉得有理。我们所做的工作或大或小,如何告诉别人,我们的工作是很重要的,其实是要讲,我们要解决的问题是如何的重要和困难,把自己的成果描述的非常有用。而我们的工作永远是个收敛的过程。前面描述的问题是宏大的,之后需要一步一步的收敛,把问题归纳到要解决的点上,解决最关键的核心问题,故而将整个问题解决。

解决问题的方法不在于有多复杂,用最简单的算法解决了最困难的问题,才是最值得称赞的。所以不要总想着研究什么新的算法,先把经典的算法搞清楚会应用,解决实际问题。

我们的ppt准备的不错,也算没白写几个月的ppt给各种领导汇报,把故事讲圆了,而且没有任何的废话,点赞。想起了自己当年去A国做论文演讲,好几年不讲了,以后有机会也需要上台讲一讲。

时间紧迫,scala代码只能算是实现了功能,有非常多的地方需要优化。而且仅仅用到spark core的部分,其实是可以利用MLlib里一些高级数据类型DataFrame来预处理数据的,可惜还没有学到,CollaborativeFilter也是现学现卖,需要加快spark core + MLlib的学习进度。

github学会了使用,确实非常好。

机器学习算法的学习不能停,还好这次是没有题目数据限定的比赛,如果以后有机会参加限定题目的比赛,对机器学习模型算法的要求就高了,趁着算是有一点点的基础,多学习多实践,不求知道每个算法的数学基础,但要知道什么问题用什么模型和算法,怎么优化调整等等。

几个wosor真心“骚”味相投,即使最后不拿奖,两天时间也特别开心,好吃好喝,连蹲坑都是一起,庆幸自己有这些好朋友,自豪自己也是其中的一份子。

正在搞新的数据,翻译新的模型算法,学习新的东西,向着新的目标出发……

 

http://www.csdn.net/article/a/2015-08-18/15827301

http://www.c114.net/news/212/a914245.html

 

END

大数据黑客马拉松(Big Data Hackathon)赛后小结

标签:

原文地址:http://www.cnblogs.com/kevingu/p/4740827.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!