本次投稿来自于一名大二学妹,在此之前从未拿过建模奖、纯纯建模新手、同时非计算机专业,接下来将以学妹第一视角给大家分享下小白美赛获奖经验。
2022年,我与另外两外两伙伴组团美赛(美国大学生数学建模竞赛),并最终获得F奖。
01、团队介绍
我们的团队阵容是:985&大二&非计算机专业&三位美少女战士!
同学A:非常具有管理才干以及商科头脑。也是我们的领头人。队伍组建主要是小A负责的。小A在暑假的时候就给大家分了学习模块的工作,比如说Matlab、图论呀,几个美赛常用建模的知识模块,我们三个人一人负责一部分。对了,写作模板也是小A找的,有模板有什么好处呢?第一个是符合参赛标准,这是最基础的。
第二个就是大家都能参与到写作任务来,因为框架定好了,填充内容也不会有很明显的割裂感。如此一来,每个人都能担任写手的任务。众所周知,写文章不是一个容易活儿,倘若全然交付给一个人,且这些任务又并不是一个人做出来的,那么其所写内容与任务本身或多或少会存在些许差距。因而大家一起写文章能分担写作的压力。
比赛刚开始就很快地给大家分工、制定开会时间。总之,队伍中有个领头羊的角色是非常必要的,这会让大家的队伍不至于向无头苍蝇一般各干各的。
同学B:同学B具有坚实的理科基础,掌握Matlab以及C语言、Python、Java等编程语言。缺点是掌握的不太好(哈哈哈哈哈哈哈你懂得就是课程上学了但是学的不是很精深)。我想如果美赛的题目很偏理工科的话,小B就会很能发挥她的长处。
同学C:嗯嗯就是我。自夸自擂肯定不是什么美德。我一下子也想不出我有什么好处。可能就是态度积极认真,队长派遣的任务都能完成……?哈哈。
除了愿意做任劳任怨的打工人以外,我应该还有一个优点就是搞科研比较多,跟导师打工。所以我看论文还是挺多的。我们的整体思路上我贡献了不少力量,就是因为我从看论文中找到了可行的解决思路。第三个能说出来的好处就是我的写作经验还是蛮丰富的,你懂得~也是跟着老师打工,疯狂盘论文、磨论文的那种。
所以我们文章提纲挈领式的总结,以及最后给评委的那一封信都是我写的。总之,我们的队伍在彼此互相了解的前提下,进行深度合作,发挥(压榨)每一个人的价值,再加一点点好运气(指走对了方向、选对了思路),我们获得了F奖的殊荣。
此外,很多人对美赛组队还存在一定的误区,下面的Q&A提供部分问题的建议:
Q:参加美赛一定要计算机专业吗?
A:不一定。应当以掌握技术为判断标准而非专业,例如我们的团队中有一位来自大气科学的同学,她会使用Matlab。其实编程能力并不是一个很好的考察标准,对于三天就要完成的美赛来说,经验和已经掌握的软件(后续会介绍不会coding也能建模的神器!!)才是更能派上用场的。
Q:三个人最好是不同专业吗?
A:不是。上一条已经说了关键要看掌握的技能。还有就是,有的时候同专业的人可能更加熟悉,这也有利于后续的分工合作。
Q:要找一个英语好的人吗?
A:不重要。现在英语翻译软件多强呀!推荐一个号称最牛的学术翻译软件DEEPL,免费的,缺点是贼慢。考虑到排版上的问题,建议一段一段翻译。找一个英语专业的人就更是浪费名额了!
02关于选题
如果没有很明显的选题偏好或者队伍明显的强项的话,还是建议每道题都看一下的。我们采取的策略是,刚发题我们三个人就DEF一人看一道,然后给出基本的解决思路。大家再一起开会商量一下,主要考量解决方案的可行性。
当时选D题是因为这个数据感觉还是挺好找的,我们后面在Kaggle(一个找数据的平台)上找到了相关的人才之类的数据集。另外两个题我记得是什么小行星采矿,还有一个碳排放。小行星那个我们听起来就觉得很离谱,一点不懂就pass了。
碳排放倒是考虑了一下,因为我们有个学大气的同学嘛。但是后来考虑到数据搜集的问题还是选择了D题。而且D题基本思路就是做一个评价模型,我们发现SPSSPRO基本上很多评价模型都能免费做,就敲定D题了。
所以,回顾我们的选题过程,我觉得有三个必要条件,才能让你选择一个适合你们的好题。
第一点,提前充分了解每个队员的特点、擅长哪个方向;
第二点,合理的选题分工,即派队员去了解题目到底在说什么,知己知彼方能百战不殆;
第三点,快速选定、快速读文献找思路&找数据,此之谓行动力。
03写作经验
提前做好模板!!这个很重要。我们当时是从美赛经验贴里下载了一份Word模板,包括表的格式等等,很方便!至于很多人提到的LateX,我觉得还是有些麻烦,美赛嘛,效率至上。但是有一个LateX在线的公式编辑器我觉得很好用,免费的,可以在上面输公式也可以从论文上截图,转成清晰可编辑的公式。
04、建模经验
比赛之前多学习一些建模软件知识是很好的,我们在寒假的时候学习了一些图论的知识还有自然语言处理、爬虫、Matlab、SPSS等。不过现实是,学了不一定能用到!!最后我们用的基本上都是SPSSPro,也是赶巧了,D题要做的评价模型,包括AHP还有模糊综合评价、熵权法SPSSPro恰好都能做。
那么我们是怎么发现SPSSPro的呢?其实在暑假准备阶段就发现了,因为很多机器学习的模型,对于我们这些非计算机专业的人来说,编程实现还是很难的,所以我们就发现了这个“平替”SPSSPro,应用起来没啥难度,老师口中的“傻瓜软件”。但是美赛有一个Bug它不关心你怎么做出来的,能出结果就行。当然如果需要获得O奖这种水平,肯定不能仅仅靠现有模型的有机组合,而是从代码底层徐徐图之。这就是大佬要考虑的事情了!
回到我们的建模思路,我们做的一个创新点就是用熵权法+专家评估法结合来评价,我们当时是选择了三个维度来评价港口效率,最后再用模糊综合评价给出最终评价的结果。
那么为什么采取这三个维度呢?其实整体的思路在题目中已经有暗示了,我们来一起做“阅读理解”。
下面是2022年D题的真题中的Requirements。首先它开门见山地说,由于种种原因啊,不能给你数据(乐)。但是呢,我会在Page 3给你列出来数据类型,那么这就不言而喻了,意思就是需要自己找符合题目要求的数据。我们来看第一个keypoint,看它加粗的部分是在强调“绩效指标”,而且指标要在people、technologies,processes三个维度。这就非常清晰了,我们这次比赛的整体思路就是围绕三个维度建模。
整体的建模过程/思路如下:
① 阅读效率评价的相关文献,从三个维度构建多级评价指标体系;
② 制定数据收集策略(尽量找评价指标体系里的数据),用尽一切手段得到目标数据,然后进行数据处理(python甚至excel都可以用上);阅读相关文献/博客,寻找可用性强的评价模型,测试模型的适用性;采用组合策略(我们是组合了RSR、AHP、TOPSIS)、优选策略不断优化设计现有模型。(PS:因为有的模型确实很难,妙用组合策略能起到很好的效果)
③ 模型评估+模型的优劣势分析(文字建模)+模型的拓展应用(这个是因为requirements里有要求~再次划重点:仔细审题!!)
05关于一些“弯路”和“歪路”
在美赛准备和实施的阶段,我们很可能走上一些“弯路”或者是“歪路”。前者很大程度上是不可避免的,例如在选题的时候选择了一种不是最优解的方案。但是这一点也无需放在心上,因为找到完美解决思路肯定是很难的而且有些运气成分在里头。然而,对于其中一些类型的弯路我们是能够尽可能避免的,例如在备赛过程中的学习、不合理的分工导致走弯路等等。
对于“歪路”,我只能说提高效率≠一味走捷径。我们在比赛的过程中也有陷入迷茫的阶段,一直找不到数据,没有数据的建模给人一种虚空的感觉。我们就在微博讨论区闲逛、各种群聊闲逛,企图发现一些找数据的思路。
我们在微博上看到一份数据好像能用,但是全部的数据那个博主收20块钱,虽然不多,但是——千万不要给!!我觉得对于我来说给人钱找数据是一件很屈辱的事情,我相信自己的检索能力!于是我顺藤摸瓜,终于在Kaggle上找到了原版的数据!
06关于Money
有人可能会担心,美赛是不是要花很多钱呀?其实还好。报名费需要637元,分到一个人头上是二百多块钱,说多不多说少不少吧。平时少搓几顿饭、少买几件衣服能省出来的。后面如果你要走歪路,那倒是会花钱,让别人帮你写这种……大可不必。首先别人写的未必有你好,你还没下功夫又怎么能知道呢?其次,有什么意义呢?不妨想想你参加比赛的初衷。
07结语
美赛虽然含金量在近几年有所下降,但是对于想保研、出国的uu来说还是值得一赛的,毕竟只有三天,也不会占用很多时间。所以我还是推荐大家参加美赛,当然,汲取大家的经验、用对方法也很重要!