如果你问CS领域哪个竞赛最出名,大多数准留学生第一反应都是想到Kaggle。
Kaggle是全球顶级的权威性数据科学竞赛平台,也是当今最大的数据科学家、机器学习开发者社区,其行业地位独一无二。它在2010年创立,专注于举办数据科学周边的线上竞赛。由于Kaggle竞赛题目有趣,不限年龄、背景和国籍,入门快且含金量高等优势,倍受准留学生们的热捧。 不过Kaggle虽好,但如果对它没有深入了解,很难在比赛中获得好名次!
为此,我们邀请到老师于5月6日在答疑群内对Kaggle竞赛进行详细解读,这里老师为大家总结了精华要点!
今天我主要从以下3个问题,对Kaggle竞赛做一个详细介绍,希望可以给有需要的留学家庭带来参考。
1.Kaggle有哪些有趣的题目,它的含金量如何?
2.哪类学生适合参加Kaggle,如何进行备赛?
3.参加Kaggle的收获如何运用到申请中?
01、Kaggle有哪些有趣的题目它的含金量如何
Kaggle竞赛不止中学生可以参加,所有计算机爱好者,甚至计算机领域的从业人员都可以报名,再加上它需要你在提供的大型数据库里找到命题所需要的数据,还需要找到最合适的方式,将所需数据整编出来,想从中脱颖而出确实有一定难度。 具体情况我们可以通过以下3个案例了解。
案例1
比如有一个相对简单一些的题目,是关于泰坦尼克号的。它的命题框架是,在泰坦尼克号的历史背景中,里面一共有2000名乘客,这些乘客的体质、背景和先天条件等都不尽相同,你需要通过提供的所有信息数据,来判断什么样的人更有可能在沉船事故中幸存。
这个题目需要参赛人把里面的重要因素挑选出来,主要研究哪些因素会真正影响一个人的存活率,是一个非常典型的统计学问题。
案例2
还有一个命题是说,我们在买房时会考虑很多不同因素,所以题目要求你通过VR或拍照等方式观测过去或现在市场上不同条件住房的出售情况,再根据给到的俄亥俄州一处居民住宅统计数据,预测这些住宅最后的成交量。
这个题目需要你通过经验去预测哪些因素会影响住房的成交及成交价格,同时通过匹配因素,比如某套房子与哪些房子类型相似,来预测这间房子的最终成交价格。这也是一个非常典型的统计学与CS匹配相结合的问题。
案例3
第3个题目案例的难度更大一些,它是说Twitter、微博等社交媒体上有时会有用户发布报警求助信息,因此社交媒体希望建立一个灾难预警识别系统,可以快速判断哪些信息是需要第一时间进行消息扩散救援的。但我们都知道社交媒体上每天用户发布的信息量非常大,所以这个题目的难度还是很大的。
通过上述案例可以发现,Kaggle选定的命题大多是生活和工作中的实际问题,能够直接跟社会需要的技能衔接,发散性强,同时还综合体现学生的逻辑分析能力、编程能力和实践能力。因此它的含金量非常高,Top 30名校也对其非常认可。
02、哪类学生适合参加Kaggle如何进行备赛
从前面的内容不难看出,Kaggle适合有一定编程基础,同时对现实问题有浓厚兴趣,并擅长运用所学知识去解决这些问题的学生。
不过,由于Kaggle的获奖难度比较大,针对性的密集备赛还是很有必要的。比如我有一个在CS方面很有天赋的学生,他从9年级开始参加计算机奥林匹克竞赛,10年级时已经达到了铂金水平,但是Kaggle依旧没办法自己搞定。
所以如果想在Kaggle中表现好一些,少不了系统性的培训和老师的1V1指导,有需要的朋友可以了解一下机构的Kaggle竞赛辅导项目。 不过即便你在Kaggle里面没能拿到好的名次,它依旧对你的申请有很大帮助。
03、参加Kaggle的收获如何运用到申请中?
参加Kaggle的收获可以通过以下3种方式运用到申请中。
1、掌握的编程语言等技能可为其他活动打基础
前面我们提到参加Kaggle需要进行相关培训,具备一定的编程基础。从这一角度,备赛过程中学习的编程语言等基础技能,可以为未来参加其他CS相关科研和独立项目做准备。
2、产出可以当作作品展示在文书中
Kaggle与其他竞赛相比最大的亮点在于它兼顾了命题与创新发散,既提供了切入角度,又给了参赛人充分发挥的空间,进而从最大程度上保证了产出。 因此,无论最终结果如何,你都解决了一个问题,而你解决这个问题的相关产出,可以当作品用来展示,也可以当作素材写进文书。
3、证明自身实力,为申请加分
由于Kaggle能够综合体现参赛人的能力,如果你做得足够好,把作品主页发给学校看,会成为申请时的超级加分项!以上就是我今天的答疑分享,希望能够帮到大家