转眼之间又到了美赛报名阶段,小伙伴们是否疑惑美赛到底有哪些题目?ABC题究竟有什么区别?别急,今天就给大家整理了一份近五年美赛MCM题目攻略,带你快速揭开MCM的神秘面纱。
01美赛题目有哪些
美国大学生数学建模竞赛分为两种类型,MCM(Mathematical Contest In Modeling)和ICM(Interdisciplinary Contest In Modeling),两种类型竞赛采用统一标准进行,竞赛题目出来之后,参数队伍通过美赛官网进行选题,一共分为6种题型。
MCM是包括A、B、C三道题目。
A题是指连续型(continuous),具体可以理解为是连续函数建立一类模型。常用方法是微分方程,并多为“数值分析”领域的内容,需要熟练掌握偏微分方程以及精通将连续性方程离散化求解的编程能力。
B题是离散型(discrete)具体需要在编程上比较熟悉计算机的 “算法与数据结构”。
C题是数据分析型(data insights),最好是有统计学、数理金融、量化分析相关背景的知识。C题除了MATLAB、Python还可以是用无需编程的SPSS,也可能会用到R、STATS、SAS等统计软件。
ICM包括D、E、F三道题目。D题一般为运筹学或网络科学(operations research/network science),近几年网络科学是一个热门研究领域,算法、软件包括可视化的软件都很多。E题是环境科学题(sustainability),大体上会集中在环境污染、资源短缺、可持续发展、生态保护等几个方面。F题是政策研究题(policy),EF题的数据一般需要自己搜集哦。
六道题目代表的类型汇总在下面的表格里啦~
MCM | ICM | ||
A题 | 连续型 | D题 | 运筹学/网络科学 |
B题 | 离散型 | E题 | 环境科学 |
C题 | 数据分析 | F题 | 政策型 |
官方给出的六个问题的描述,对于选题有一定的提示作用,但是六道题目之间没有严格的模型划分,解答范围仍然很广,每道题所用模型、方法没有明显的界限。因此小伙伴们在寒假先要摸清楚不同题目常用的模型算法、写作套路以及题目风格,比赛时根据自己队伍擅长的东西慎重选题。
02近五年美赛A题特点
分析,在六道题目中,相对而言,A题是对同学们的数学模型素养以及建模能力要求较高的。同时A题的专业性较强,非专业相关的同学对题目的理解较难。
例如2018年的A题:多跳HF无线电传播,这道赛题包含大量的专业名词,如电离层、最大可用频率、地面源、连续跳跃、局部介电常数等,大大增加了同学们对赛题的理解难度。可能在比赛的第一天就要花上几个小时先百度清楚这道题里面的术语,从而保证能正确地理解题中描述的物理过程。
图:2018年A题
同样, 2018年A题的许多O奖论文中,出现了大量的物理示意图和解析图,可谓是一边建模,一边“穿越”回到数学与物理课堂,和队友一起在线头秃,互相讲题。
图:2018年A题O奖队伍#76271
图:2018年A题O奖队伍#76082
但A题只有晦涩难懂的一面吗?不,A题有时候还很有想象力,非常具有美赛特色。咱们一起来看看2019年的A题吧,关于养龙这件事你有什么方法吗?题目叫做”A Game of Ecology”,这确定不是”A Game of Thrones”?
题目背景是说,在虚构的电视剧《权力的游戏》中,根据史诗奇幻小说《冰与火之歌》改编,三条龙由“龙之母”丹妮莉丝 · 坦格利安抚养长大孵化出来的龙很小,大约10公斤,一年后长到大约30-40公斤。它们一生都在继续生长,但这取决于它们所能获得的食物的条件和数量。想象一下这三条虚构的龙现在活着。
假设上面描述的龙的基本生物学是准确的。你需要对龙做出一些额外的假设,比如,龙能够飞得很远,喷火,还能抵抗巨大的创伤。你的团队负责分析龙的特征,行为,习惯,饮食,以及与环境的互动。一旦你对龙的分析完成,写一封两页的信给《冰与火之歌》的作者,乔治·马丁,提供关于如何保持故事的真实生态基础的指导,特别是关于龙从干旱地区迁移到温带地区和北极地区的情况。
乍一看这不是要咱们给作者出出主意,告诉他应该如何“科学养龙”,但仔细理解后不难发现,这道题实际上是生态学问题,建模要考虑气候因素、地理环境以及生物特征等因素,从而给出龙生存的机理分析。
脑洞大开的A题激发了许多队伍的想象力,有的O奖队伍甚至展现了精湛的绘画技术,把“龙”画在了论文里,展现了“漫画沉浸式”答题,下面几张图片就是该优秀论文里面的几张手画图片,感兴趣的小伙伴可以整篇文章都看看哦。看到这里的小伙伴们是不是对今年的A题有所期待了呢?
图:2019年A题O奖队伍#1910246
图:权力的游戏第八季海报宣传
另外,A题近两年的题目偏机理分析与预测类,例如,2020年A题向北移动(Moving North),题目中要求预测两种鱼类在未来五十年内最有可能出现的位置,并且使用模型来预测最佳情况、最坏情况和最有可能出现的时间。2021年A题真菌繁殖(Funji)提供一个模型以描述不同类型真菌之间的相互作用。
相互作用的动态性描述应该包括短期和长期趋势。还应该检查对环境变化波动的敏感性,并确定大气环境的不变变化趋势是什么,以辅助评估天气变化对模型的影响。还要包括对“每个物种”或“可能持续一段时间的物种组合”的相对优势和相对劣势的预测,并对干旱、半干旱、温带、乔木、热带雨林等不同环境进行预测。
因此,大家在美赛A题的学习中可以多准备一些机理分析、预测相关的模型算法和解题思路,如时间序列模型、遗传算法、神经网络、微分方程求解等。微分方程可以使用常见软件MATLAB来求解分析,并且微分方程可以写成一般的函数形式。微分方程的建模必须做数值模拟,可以采用MATLAB来做方程的表达形式图形,画出变量间的关系。
03近五年美赛B题特点
分析,在六道题目中,相对而言,B题常常喜欢出优化类问题、图论问题以及规划类预测类问题。特别是对比2019年和2021年的B题,让人有一种“新瓶换旧酒”的错觉,不过仔细做起题来又有很多的差别。
首先,2019年B题派遣无人机空难救援,是标准的优化、图论问题。
2019B题的第一问:整数规划问题;第二问动态规划问题;第三问调度方案。
2019年B题O奖获奖队伍#1915782的解题思路是:建立单目标规划模型,以ISO集装箱的空间利用率最大为目标,并定义了在装载过程中的约束条件。并采用改进的3D-RSO算法进行求解。针对选址问题,以运输时间最短和总侦察路程最长为目标,建立了确定ISO集装箱数量和位置的双目标规划模型。
让我们再来看看2021年B题,无人机澳大利亚大火救灾,它是典型的优化、NP类问题,可能用到图论类的模型、规划模型、遗传算法等。
第一问要求为“CFA的新部门——山火应急响应部门”建立一个模型,用于购买最优数量比例的SSA无人机和无线电中继器无人机。第二问说明你的模型是如何适应“未来十年极端山火事件”可能发生的变化?第三问设计一个模型,以优化不同地形上的不同火情大小的VHF/UHF无线电中继器无人机的位置。
2021年优秀论文队伍#2127300的思路是:针对第一问采用目标为设备成本最小化和消防效率和安全最大化进行优化,利用遗传算法求解,得到最优方案为中继器24架,SSA无人机数量30架,总预算54万美元。针对第二问,训练LSTIM模型预测未来十年的温度,对火场数量与日温度关系进行回归分析,预测火场情况,模拟极端火灾情况,代入第一问模型求得新的结果。问题三限制了EOC与高山之间的距离,优化了一对移动EOC的搜索模型,找到9个移动EOC。对遗传模型进行优化,得到中继机数量16架,最后评估了模型的稳定性。
同样的,在2017年的B题车辆收费站问题,是典型的的优化问题,需要考虑收费站的形状、大小、合并区域、吞吐量、事故预防、混合车道、ETC车道,自动驾驶车辆等等;确定收费站区域的数量;减少车辆合并的平均旅行时间和平均延迟时间;考虑特殊车道,用于交通繁忙和紧急情况;交通流量对收费站容量的影响;收费站是否能满足自动驾驶汽车的需求。2018年B题语言种类问题,属于图论选址问题,考虑题目所给的因素,建立各种语言人群关于时间的分布模型;预测这些语言随时间的地理分布,并为新办公室提供位置选择。
因此,可以发现对于美赛B题要多加练习规划类问题、优化类问题、图论问题、选址规划等等,积累多元分析法、遗传算法、贪婪算法、神经网络、元胞自动机等多种算法,模型中善于改变约束条件进行优化。对于离散型的变量和建立离散模型,可以运用多元统计分析方法来分析,如聚类分析、主成分分析、因子分析等。
04近五年美赛C题特点
美赛的C题是专门考验队伍对数据的处理和统计识别的一道题目,偏重于数据挖掘和编程能力。相对而言,C题的数据量在六道赛题中是最多的。并且一般数据是由题目给定的,2021年美赛C题确认关于黄蜂的传言,它的数据是需要提前一天进入官网下载数据加密压缩包,在发题当天再输入密码破解数据文件。下载的数据集包含4440份的目击事件电子表格,其中3305项含有图片ID和Global ID的数据。对数据需要进行预处理等,可以采用机器学习、数据相关性模型、皮尔斯系数、肯德尔系数等等。
另外,在2019年C题阿片类药物危机问题,官方提供了几个供使用的数据集。
第一个文件(MCM_NFLIS_Data.xlsx)包含2010-2017年间这五个州每个县的麻醉性镇痛剂(合成阿片类药物)和海洛因的毒品识别计数。另外七个文件是压缩文件夹,其中包含美国人口普查局的摘录,这些摘录代表了在2010-2016年间每年这五个州的县收集的一组共同的社会经济因素(ACS_xx_5YR_DP02.zip)。第一问,利用NFLIS提供的数据,建立一个数学模型,描述所报告的合成阿片类药物和海洛因事件(病例)在这五个州及其县之间一段时间内的传播情况和特点。
第二问,利用提供的美国人口普查社会经济数据,解决以下问题:谁在使用/滥用阿片类药物,是什么导致了阿片类药物的使用和成瘾的增长,以及为什么尽管阿片类药物的使用存在已知的危险,但阿片类药物的使用仍然存在。使用情况或使用趋势是否与提供的任何美国人口普查社会经济数据有某种关联?很显然问题也是引导大家建模后挖掘数据背后的深层信息,找到一些关联和数据趋势。
针对该题,2019年C题O奖队伍#1901213用马尔科夫方法建模,从而可视化了2010年至2016年期间阿片类药物在该地区的移动和传播。对整个数据集的社会经济因素的影响进行了建模,并将这些变化与该县阿片类药物的使用随时间的增长或减少联系起来。
最后进行了多次模拟,并预测了毒品问题在未来很长一段时间内的情况,以便从不同的角度制定一些应对流行病的策略,从对阿片类药物传播影响最大的变量中进行选择。下图,是2016年与2017年3-甲基芬太尼县级毒品报告可视化地图。
图源:2019年B题
优秀论文总的来看美赛C题会要求掌握数据挖掘处理的相关方法,包括预处理、后处理等。模型、方法方面,可能主要集中在统计、模式识别等方向。数据预处理的基本方法包括处理异常值、缺失值等。数据分析与建模常常需要合并参数(包括拟合、主成分分析等),以及数据归一化。在C题中也可以运用如Python、SPSS、SAS等软件平台处理数据。
大家看过了MCM的三大赛题之后是不是对A、B、C题的风格更加了解呢?迫不及待想看一看往年真题了吧?敲黑板再次总结一下:A题主要为优化与控制或者策略分析类赛题,需要有一定的微积分和目标及过程优化能力;B题主要是离散型赛题,常见出题点为回归或聚类分析、协同规划等;C题为大数据赛题,一般数据处理与分析是必不可少的,进行相关的模式识别或信息挖掘等。虽然每类赛题都各有特色,但获得大奖的秘诀往往是扎实的模型基础、出色的编程能力、创新性较强的写作展示以及团队的默契配合,期待大家都能取得优异的比赛成绩!