码迷,mamicode.com
首页 > 其他好文 > 详细

十年树木,百年树人:从这场竞赛看百度的AI人才培养视野

时间:2020-12-21 11:50:33      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:打破   消费   data   之一   data-   回顾   表示   检测   控制   

人们很难想象,学生可以有着何等的热情与专注。

“自从参加了百度组织的国际大数据竞赛后,我就没有在晚上12点前躺在床上过。”来自同济大学的崔啸萱对记者开启了她的吐槽:“作为研一学生,我还有一份实习,所以白天基本是被占用满了,只有晚上和周末的时间来争分多秒地搞比赛。”

这场赛事的初赛与复赛阶段,选手的方案得分将会实时呈现在排行榜上,名次成为进入决赛阶段的依据,因此,这份榜单成为包括崔啸萱在内许多选手在白天苦苦思索、在晚上辗转难眠的直接原因。

技术图片
(赛事实时排名榜单)

作为“黄渡龙舟队”的成员,崔啸萱最终入围了2020IKCEST 第二届“一带一路”国际大数据竞赛暨第六届百度&西安交大大数据竞赛(以下简称国际大数据竞赛)的决赛阶段。10月18日,团队们抵达位于西安的中国西部科技创新港,与来自五湖四海的高校学子们登上了领奖台。

实际上,2020国际大数据竞赛的特殊之处不仅仅在于高权威、高曝光、高奖金对学子们的吸引力,更重要的是为他们提供了“身在校园、心系社会”的实践舞台。

技术图片

一场贴合了当下社会热点的赛事

“传染病本身其实是具有很大的先验信息的,传染病一般前期会增长很快,后期随着政府管控会逐渐趋于平稳。那这些特性并不是仅仅能通过一个AI模型去预测得到。如何用先验知识给模型增加可解释性,又可以结合AI模型去对细粒度数据更好的预测这既是这个比赛的关键,更是现在疫情预测实际应用中的一大瓶颈……”

在谈到参赛心得的时候,来自冠军团队“打完BDC再来”的西安交通大学冉宪东已经对传染病传播规律有了一定的了解——虽然他的专业是计算机相关。

技术图片
(国际特等奖获奖团队“打完BDC再来”)

这源于今年国际大数据竞赛赛题的特殊性:针对赛题所构造的若干虚拟城市,构造传染病群体传播预测模型,根据该地区传染病的历史每日新增感染人数、城市间迁徙指数、网格人流量指数、网格联系强度和天气等数据,预测群体未来一段时间每日新增感染人数。

本届大赛首次关联医学课题,赛题设置为“高致病性传染病的传播趋势预测”。这一赛题打破了AI与现实医学的“次元壁”,冀望运用大数据技术助力传染病的传播预测和控制,增强人类社会合作抗风险的意识和能力,也为年轻人提供了参与社会议题的平台。

2020大数据竞赛也确实实现了这一目标。对于国际特等奖获奖团队,评委团评价选手“具备很强的数据洞察能力,能利用数据可视化,深入数据分析和理解”,获奖方案在特征工程鲁棒性、模型方案创新性与泛化能力上表现突出,并认为,整体方案有很强的落地实用价值。

技术图片
(国际特等奖“打完BDC再来”整体解决方案框架)

技术图片

升格国际赛事第二年:大数据竞赛正在汇聚全球菁英

对国内的高校而言,百度&西安交大大数据竞赛是很熟悉的老牌赛事,已经举办了六届,无数青年菁英学子从这里脱颖而出。

国际大数据竞赛由中国工程院、教育部高等学校大学计算机课程教学指导委员会及丝绸之路大学联盟指导,联合国教科文组织国际工程科技知识中心(IKCEST)、中国工程科技知识中心(CKCEST)、百度、西安交通大学共同主办。

赛事旨在放眼“一带一路”倡议沿线国家,实现“政府—产业—高校”合力推动大数据产业研究、应用、发展的目标,进一步夯实赛事的理论基础与实践基础,通过竞赛方式挖掘全球大数据、人工智能顶尖人才。

技术图片
(2020国际大数据竞赛官方海报)

作为全球最顶级的大数据赛事之一,国际大数据竞赛今年共有超过3000支赛队近5000人参赛,覆盖五大洲22个国家580所高校,包括哈佛大学、帝国理工、伦敦大学等世界名校,和国内42所双一流高校;其中,仅美国就有28所高校组队参赛。此外,大赛还首次吸引来自南非、俄罗斯、印度等国家的选手团队。

顾问委员会、评委团阵容同样豪华。大赛评委邀请到了图灵奖得主Raj Reddy、中国工程院潘云鹤院士、中国工程院院士郑南宁、百度CTO王海峰等来自全球的学界、业界权威专家,大大提升了赛事的国际化和专业化程度。

大赛还特意聘请中国工程院副院长王辰院士与复旦大学内科学系主任、华山医院感染科主任张文宏担任竞赛顾问,为选手们提供了医学界前沿的视角与观点,帮助他们更好地理解赛题。

贴合复杂现实的赛题、海量的参赛选手、高规格的专家顾问团,意味着更加严格的选拔标准与赛事权威性。经过初赛、复赛、决赛环节后,共决出特等奖、一等奖、二等奖、三等奖共计16支优胜队伍,从队伍数量看来入围率仅0.53%,可见竞争的激烈程度。

技术图片
(西安交通大学党委书记张迈曾、中国工程院院士郑南宁、百度CTO王海峰共同为冠军选手颁发奖项)

各路选手也倾注了极大的心血与投入。国际一等奖团队“岳麓F4”成员、中南大学计算机专业的研一新生郭海富,初赛期间突发39.9°高烧,依然坚持在隔离酒店内一边做核酸检测一边进行代码整合与提交的工作;有颜值的团队”仲伟渊是南京大学在读研究生,同时也已为人父,一忙起来连陪伴老婆孩子的时间都变少了;冉宪东甚至用自己参与其他赛事的奖金购置了服务器,力求拿出高水准的表现。

技术图片

AI技术加速脱虚向实,赛事“更接地气”

当下,人工智能技术蓬勃发展,早已走出了学术象牙塔,在各大产业落地。

与之相对应,AI相关专业甚至是更广泛的计算机专业的高校学子们,都将更多地面临真实世界中的复杂问题。近年来,我国在校学生的实习、赛事、项目都呈现出越来越强烈的实用主义倾向,以求为学生提供更加贴近产业场景的实践,解决理论脱离实际、技术难以落地的顽疾。

百度与西安交通大学创办的大数据竞赛无疑是其中的佼佼者,前五届赛题分别为构建数据挖掘系统自动生成关系网络、构建数据挖掘系统辅助消费决策、宠物狗种类识别、商家招牌的分类与检测、基于遥感影像和用户行为的城市区域功能分类,非常接地气,也让参赛学子充分认识到技术在现实中落地的复杂性。

技术图片
(2019年国际大数据竞赛聚焦了时下“智慧城市”规划的热门议题)

而今年,与传染病相关的赛题设计,更是让学子们关注当下、学以致用的绝佳机会。仲伟渊正是出于想为抗疫做贡献的初衷参赛,表示“十分感谢组委会组织这次比赛,让所有人都有机会为抗疫贡献出自己的一份力量。”

此外,大量人工智能、大数据技术在疫情期间开始跨领域发挥作用,为抗疫防疫作出了巨大贡献,也催生了相关人才需求。赛事期间,张文宏医生曾寄语学子:“我们非常期盼从事大数据领域和医学领域的人才能够结合,能够给我们国家的防疫专家提供非常好的数据。未来可以在数据的预测里面,在世界上能够掌握发言权。”

不仅仅是医疗界,人工智能行业也开始认识到跨领域人才的重要性。在4月份国际大数据竞赛启动时,王海峰与王辰也谈到,复合型人才在AI产业正在越来越重要。王辰院士认为,长远来看,医学的发展需要多个学科的共融共通,打破医学界与包括信息科学界在内其他领域之间的坚冰,将会让医学发展迸发出更大的动力。王海峰也直言,“未来,想要更好的打破医学界跟信息科学界、大数据相关技术之间的坚冰,培养复合型人才可能会发挥更大价值。”

技术图片
(中国工程院副院长、院士、呼吸病学与危重症医学专家王辰与百度CTO王海峰)

技术图片

赛事成AI教育重要一环,企业加大AI人才培养投入

在很多人的印象中,人才培养是政府和教育界的范畴,而在理论与实践结合要求非常高的人工智能领域,企业正在成为人才培养的主力军,国际大数据竞赛就是一个很好的例子。

基于大数据竞赛平台的独特人才培养模式得到了参赛选手、高校教师与业内专家的一致认可。大赛以具体项目为载体,以工作任务为驱动,将理论与实践有机结合,在不断反复的学习实践过程中寻找到解决问题的方法,这也与企业实习的形式高度一致。多个选手表示,三个月的参赛过程,是一个绝佳的将知识融会贯通的过程。

技术图片
(赛事核心理念)

因此,以百度为首的人工智能企业,很早就开始主办各类赛事,并且覆盖了赛事组织、导师指导、奖金资源等环节。国际大数据竞赛对算力、数据等资源有着较高要求,百度承担国际大数据竞赛的主办工作,为所有选手提供了飞桨深度学习开源框架以及其他数据资源,助力选手数据模型的搭建与训练,让参赛学子没有后顾之忧,得以一展长材。

竞赛顾问委员会主席、图灵奖得主、中国工程院外籍院士Raj Reddy教授就曾表示:“大学是人工智能人才的摇篮,但必须承认,学校在数据、计算机硬件和应用场景等方面缺乏资源,这样的比赛可以探索可行的解决途径。比赛所采用的数据以及大量的算力资源是高校难以获得的,而这正是百度这样的企业参与进来的优势和价值。”

图片
(竞赛顾问委员会主席、图灵奖得主、中国工程院外籍院士RajReddy教授)

此外,作为国内人工智能“领头雁”,百度不仅在AI技术研发上大力投入,也与政府、高校开展战略合作,开办师资培训班、开展线上课程、编写专业教材、提供实践机会,逐步形成了学习、实践、比赛、认证、就业的全周期服务体系闭环,助力国内人工智能人才梯队建设。

王海峰博士也认为,人工智能作为第四次工业革命的核心驱动力量,正在改变着我们的生产生活方式,这就需要培养更多的人工智能人才。目前百度已与社会各界展开合作,未来5年帮助社会培养500万AI人才,推动整个社会智能化升级。

企业参与人才培养,不仅仅是为自身未来人才储备做打算,也有着更多推动行业繁荣、提升科研竞争力的考虑,无论是行业、高校甚至国家层面,也乐见更多像国际大数据竞赛一样贴近现实实践的顶级赛事出现,为学子提供通往社会的“摆渡船”。

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组:杜梦迪、元艺博
相关链接:
https://towardsdatascience.com/how-to-plan-and-organize-a-data-science-analytics-project-a9418c12c808

如转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读
EMNLP2017论文集28篇论文解读
2018年AI三大顶会中国学术成果全链接
ACL2017论文集:34篇解读干货全在这里
10篇AAAI2017经典论文回顾

长按识别二维码可添加关注
读芯君爱你

技术图片

十年树木,百年树人:从这场竞赛看百度的AI人才培养视野

标签:打破   消费   data   之一   data-   回顾   表示   检测   控制   

原文地址:https://blog.51cto.com/15057819/2564766

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!