转眼之间又到了美赛报名阶段,小伙伴们是否疑惑美赛到底有哪些题目?自己适合选哪类题呢?今天就继续继续带大家来剖析ICM(D、E、F题)特点,赶快一起来看看吧~
美国大学生数学建模竞赛ICM,Interdisciplinary Contest In Modeling,是交叉学科背景的数模赛题,用到的模型相对MCM题目而言更偏向评价决策、模型计算结果更具有开放性而非优化类问题较为固定的答案。ICM一般涉及的问题较宏观和复杂,对于参赛者把握问题主线、权衡宏观与微观、整体与细节的能力要求较高。所以对于数学求解能力相对较弱的队伍,岛主建议可以优先考虑ICM的赛题,保证队伍能顺利完成答题过程,同时ICM的题目对写作文字方面具备较大的发挥空间。ICM三道赛题各具特色,接下来岛主带你走近美赛ICM近五年真题,好好体验一下ICM的魅力~
01
近五年美赛D题特点美赛D题一般为运筹学或网络科学领域赛题(operations research/network science),近几年网络科学是一个热门研究领域,算法、软件包括可视化的软件都很多。
近三年的题目都需要用到最基本的网络模型算法以及可视化,小伙伴们建议选择D题首先要在编程上必须学会Gephi等有用的网络关系图图绘图工具。Gephi是在Netbeans平台上开发,语言是JAVA,并且使用OpenGL作为它的可视化引擎。依赖于它的APIs,开发者可以编写自己感兴趣的插件,创建新的功能。建议小伙伴们去B站等平台找一找有关中文教程学习。除此之外,D题大部分建模以及求解都是建立在一定的网络关系上的,这就说明网络图是一个基础解题起点,答案需要根据它不断的向外扩展和变形。赛题数据方面,组委会一般会给出赛题所需数据包,参赛队伍无需像E题等赛题自己找额外的数据使用。
言归正传,下面带你快速分析美赛D题真题情况。
(1)2019年D题——“Time to leave the Louvre”(译:是时候离开卢浮宫了)这一年的D题非常具有美赛“脑洞大开”的特点,2019年D题被广大数模友人戏称为“卢浮宫大逃亡”。如果说你想要掌握美赛的图论规划类题型思路,那你一定不要错过这道题目。
首先我们来简要看看题目:
您的ICM团队正在帮助设计法国巴黎卢浮宫的疏散计划。一般来说,疏散的目标是让所有住户尽快安全地离开大楼。一旦接到要求疏散的通知,人们就会离开,并通过一个最佳的出口,以便尽快清空大楼。卢浮宫有五层,其中两层在地下。并给出了卢浮宫的各层示意图。
您的主管希望您的ICM团队开发一种紧急疏散模式,允许博物馆领导探索一系列选项以疏散博物馆中的游客,同时还允许紧急救援人员尽快进入大楼。重要的是要找出可能会限制通向出口的潜在瓶颈。博物馆应急策划者特别感兴趣的是一种适应性强的模型,这种模型可以设计成解决一系列广泛的考虑因素和各种类型的潜在威胁。每个威胁都有可能改变或删除可能的路径段,使其达到安全状态,而这在单个优化的路径中可能是必不可少的。开发完成后,验证您的模型并讨论卢浮宫将如何实施它。根据你的工作结果,提出卢浮宫应急管理的政策和程序建议。包括您的团队认为对访客安全有必要的任何适用的人群管理和控制程序。此外,讨论如何调整和实施您的模型以适应其他大型、拥挤的结构。
看完题目后是不是发现这是一道卢浮宫疏散计划的图论规划问题?然而有关卢浮宫的信息,题目中没有直接整理成文档发出来,而是需要参赛者根据题目提到的参考信息,登录卢浮宫官网、或登录在线应用程序进一步搜集资料和应用(如图1所示)。这就加大了该题目解答的难度和开放性。同时改题目的网络图形绘制难度较大,意味着做答人需要具备AutoCAD、3Dmax等绘图工具,以展示卢浮宫五层楼的疏散示意图。模型算法上可以查文献,现学现用,有关多层建筑物应急疏散模型和算法,并运用多目标优化模型等优化方案。
图1 卢浮宫地图及艺术品位置(来源卢浮宫官网截图)
求解思路以优秀论文Team#19020407为例,首先建立了总疏散时间最短的目标规划模型,以保证建筑物内人员安全、快速疏散。该模型将疏散时间划分为房间通道移动阶段、上下建筑阶段、进出阶段和事故发生阶段。通过对每个阶段进行优化,实现了总时间最小的目标。并对Dijkstra算法进行了改进,找到了从每个房间到出口的最有效路径。另外,根据目标规划,提出了同楼层之间的动态调度算法和不同楼层之间的动态调度算法来解决拥堵问题。此外,针对弱势群体的不同特点设计了有针对性的应对策略,以减少事故的发生。
图2 Team#19020407论文配图7
图3Team#19020407论文配图9
不难看到在这篇优秀论文里除了常规的规划模型之外,还巧妙地通过划分移动空间阶段、优化图论算法、对每个阶段都进行优化来达到更为精确和先进的优化方式。并且充分考虑了弱势群体的因素进行策略讨论。模型不算高端但是应用的非常充足和合理,加上好看的排版和示意图,让这篇文章脱颖而出。
(2)2020年与2021年D题——网络关系图与评价指标体系相结合的建模思路如果说2019年的题目更偏重图论规划和优化模型,2020年与2021年的模型更偏重于网络关系模式图的运用以及对影响因素的探讨。
2020年的题目是有关足球队伍合作策略的评价,2021年是有关音乐影响力,音乐流派等音乐特性的演变问题。首先来看看2020年美赛D题:团队战略。
哈士奇足球队的教练请你的公司Intrepid Champion Modeling(ICM)帮助了解球队的动态。尤其是,教练要求你探索球场上球员之间复杂的互动是如何影响他们的成功的。我们的目标不仅是检查直接导致得分的互动,而且探索整个比赛和整个赛季的团队动态,帮助确定下个赛季可以改善团队合作的具体策略。教练已经要求ICM对球队成功(和不成功)的结构和动力学特征进行量化和正式化。哈士奇提供了上个赛季的详细信息,包括他们与19个对手进行的所有38场比赛(他们对每个对手都打了两场)。总体而言,数据涵盖了366名球员(30名哈士奇球员和336名来自对方球队的球员)之间的23429次传球,以及59271场比赛。
参赛队伍需要为球员之间的传球创建一个网络,其中每个球员都是一个节点,每一次传球都构成球员之间的链接。使用您的传球网络来识别网络模式,例如二元和三元配置以及团队编队。还要考虑整个奥运会的其他结构指标和网络属性。探索多个尺度,例如,但不限于,在观察互动时,微观(成对)到宏观(所有球员),以及时间,如短(分钟到分钟)到长(整个比赛或整个赛季)。还需要确定反映成功团队合作(除了得分或胜利之外)的绩效指标,例如比赛类型的多样性、球员之间的协调或贡献的分配。随着我们的社会越来越多地解决涉及团队的问题,你能概括一下你的发现,谈谈如何设计更有效的团队吗?要开发团队绩效的通用模型,还需要捕获团队工作的哪些其他方面?
看完题目后是不是发现这是一道足球比赛传球策略的网络科学背景问题呢?没错这道题目的参考论文里面还包括了应用这种网络科学的期刊文章。而所有问题讨论的原点就是创建一个球员之间的传球网络,其中每个球员都是一个节点,每一次传球都构成球员之间的链接。并利用它来识别球队传球的网络模式。
同样的2021年的D题也是将所有问题的解答建立在网络关系模型的基础之上。带着对比的学习方法,来一起看看2021年D题吧。
题目背景:我们的目标是了解和衡量以前制作的音乐对新音乐和音乐艺术家的影响。可以通过歌曲特征(如结构、节奏或歌词)之间的相似程度来衡量影响。通过考虑歌曲的网络和它们的音乐特征,我们可以捕捉到音乐艺术家对彼此的影响。我们还可以更好地理解音乐是如何随着时间的推移在社会中演变的。
题目数据:您的团队已被综合集体音乐协会(ICM)指定开发一种衡量音乐影响力的模型。这个问题要求你考察艺术家和流派的进化和革命趋势。为此,ICM向您的团队提供了几个数据集:
(1)“Influence_Data”1代表艺人自己报道的音乐影响者和追随者,以及行业专家的意见。这些数据包含5854名艺术家在过去90年中的影响力和追随者。(2)“Full_Music_Data”2提供16个可变条目,包括可舞性、节拍、响度和音调等音乐特征,以及98,340首歌曲中每首歌曲的艺术家名称和艺术家ID。注意:这些文件中提供的数据是较大数据集的子集。这些文件包含您应该用来解决此问题的唯一数据。
题目要求
(1)使用Influence_Data数据集或其中的一部分创建音乐影响力的(多个)定向网络,其中影响者连接到追随者。开发参数来捕捉这个网络中的“音乐影响力”。通过创建定向影响者网络的子网络来探索音乐影响力的子集。描述此子网。在这个子网络中,你的“音乐影响力”指标揭示了什么?
(2)使用FULL_MUSIC_DATA和/或音乐特征的两个汇总数据集(具有艺术家和年份)来开发音乐相似性度量。
(3)指示DATA_ENAFSONCE数据集中报告的相似性数据是否表明识别出的影响者实际上影响了各自的艺术家。
(4)分析一种流派中随着时间发生的音乐演变的影响过程。您的团队能否确定能够揭示动态影响者的指标,并解释流派或艺术家如何随着时间的推移而变化?
(5)你的作品如何表达音乐在时间或环境中对文化的影响?或者,如何在网络中识别社会、政治或技术变化(如互联网)的影响?
根据上面的题目不难看出,2021年的D题是需要开发一种衡量音乐影响力的模型。这个问题要求参赛者考察艺术家和流派的进化和革命趋势。
该题目要求的第一步就是使用Influence_Data数据集创建音乐影响力的多个定向网络,其中影响者连接到追随者。显然是需要对网络关系图进行数据点的选取和绘制,并且描述其中的关系。同时要开发参数来捕捉这个网络中的“音乐影响力”, 并且可以开发整体网络密度、网络中心度和关联凝聚性等参数作为音乐影响力描述性指标,来捕捉这个网络中的“音乐影响力”。岛主截取了20年D题和21年D题的优秀论文图片,可以看到这个网络模型的数据可视化后图形非常的炫酷。
图4 Team#2001720 传球网络模式图
图5 Team#2109311 音乐影响的有向子网
对于音乐影响力的有向子网而言,网络图中音乐艺术家所能产生的影响力可直观地通过连出度表示。节点连出线条的数量代表连出度。连出度在网络图形中以节点的面积大小与标签面积的大小表示。节点面积越大,追随者越多。同时节点与节点之间所构成的链接为单向的,从影响者到追随者的关系。
此外在21年D题中,描述音乐影响力的影响因素时,可以建立多个音乐特征子指标,结合熵权法计算权重,综合出四个综合评价指标来描述音乐特性,在20年的D题中选取多个方面的指标组成足球队的合作绩效指标体系。
通过深入浅出的分析,同学们不难总结出D题的主要特点:网络关系图的绘制是必备的技能,在近三年的赛题中出现频繁,大胆预测2022年的D题还会涉及到类似的网络数据需要处理。此外,模型的背景都很有意思,音乐家这道题目很多参赛者甚至利用苹果自带的音乐APP去搜题目里出现的歌手具有的音乐特征,比如猫王、披头士、霉霉、碧昂丝等著名音乐人。D题对于队伍的编程而言会有一定的难度,需要提前准备聚类分析、Markov链、Gephi可视化等技能。建模更多偏向灵活性高,但是用到的基本模型较为简单,例如对评价方法与不同的求权重方法的组合、以及选取指标的考虑等等。这道题如果寒假准备充分,在正式比赛遇到的时候思路将会较为清晰。
02
近五年美赛E题特点
E题是环境科学背景的题目,大体上会集中在环境污染、资源短缺、可持续发展、生态保护等几个方面。对问题的背景有一定的提示作用,而且范围仍然很广。如果涉及到评价问题,可以用某种或多种评估的方法对参与评价的“对象”进行排名分析。
在建模方法的选择上主要有TOPSIS理想解法,找出理想最优解,根据样本和“最优解”的“距离”进行排名;模糊综合评价,适用于评价标准是等级这种模糊的评价,如人事考察等;数据包络分析的cr模型,用于对象之间的同等级比较,比较的是样本之间的相对效率;灰色关联度评价方法,求出每一个样本与最优解的灰色关联度即相似度进而进行排名;主成分分析,将原有的影响因素进行线性组合后选出主要成分再对其分析排名;秩和比综合评价法,可用于医疗卫生领域,工作质量的多指标综合评价。
分析近五年美赛E图不难发现,这道题目首先难点就在于数据的寻找,题目不会直接给出数据集。这里给大家分享几个常用的美赛数据查找网站,宝子们还不快火速收藏起来?
例如:联合国数据中心:
https://www.un.org/zh/databases/。
联合国粮食及农业组织:
http://www.fao.org/faostat/en/。
谷歌学术:http://ac.scmor.com/
美国运输统计局:https://www.bts.gov/
美国劳工统计局:https://stats.bls.gov/。
美国农业部:https://www.usda.gov/。
美国人口统计局:http://www.census.gov/。
美国普查局:
http://2010.census.gov/2010census/language/chinese-simplified.php。
另外,美赛E题往往是评价预测类问题,例如2018年E题是以气候变化影响国家脆弱性为背景,属于评价和预测类问题;2019年E题是生态服务评估模型,加成本效益分析;2020年E题需要指数表征塑料污染严重程度,也属于评价类问题;2021年E题含有食品系统模型以及成本效益、可持续性模型。
下面,带你看一看2019年E题——“环境退化的代价是什么”
经济学理论往往忽视其决策对生物圈的影响,或者假设没有限制的资源或能力来满足生物圈的需要。这种观点存在缺陷,环境现在正面临后果。生物圈提供了许多自然过程来维持健康和可持续的人类生活环境,这就是所谓的生态系统服务。然而,只要人类改变生态系统,我们就有可能限制或移除生态系统服务。现在考虑一下这些项目中的许多项目在一个地区、国家和世界范围内的影响。有没有可能对土地利用开发项目的环境成本进行估价?环境退化将如何计入这些项目成本?一旦将生态系统服务计入项目的成本效益比,就可以确定和评估该项目的真实和全面的估值。
您的ICM团队已受雇创建生态服务评估模型,以便在考虑生态系统服务时了解土地使用项目的真实经济成本。使用您的模型对不同规模的土地利用开发项目(从基于社区的小型项目到大型国家项目)执行成本效益分析。根据您的分析和模型设计评估模型的有效性。您的建模对土地利用项目规划者和管理者有何影响?随着时间的推移,您的模型可能需要如何更改?
这道题目相比其他赛题并不长,但是问题的灵活性非常大,例如生态服务评估模型的建立考虑的因素可以包括人类社会对生态影响的众多因素,如何合理的确定指标体系以及权重计算是需要考虑的。同时,模型的有效性如何评估?模型实用性方面也要考虑随时间推移而改变。题目同样贯彻了E题没有数据直接提供的特色,岛主建议拿到E题应首先快速找到可用数据,然后搭建基本模型,再增加模型细节,并在解题中获得灵感。
总得来说,美赛E题的细节和写作的要求相对较高,一般参加队伍拿奖容易但是获得M奖及以上较为困难,就是因为看起来简单实际想要与众不同、脱颖而出是较为困难的。这道题适合新手小白,对于想要获得大奖的队伍需要研究往年E题的特点,培养更全面的建模分析能力,将O奖文章的套路烂熟于心。
03
近五年美赛F题特点
美赛F题通常是相对而言建模和编程难度最小的,但比较考验队伍的模型应用适配度以及写作的结果分析是否出彩,比较适合社科类的同学选择。并且F题主要是政策问题,会涉及到如何制定政策,制定政策需要考虑的对象,成本,限制因素,成效等一系列相关问题。题目发挥空间较大,背景与经济政策有关,适合经管专业学生当建模、写作。
下面带大家来看看2019年F题——“通用的、分散的、数字货币:可能吗?”
数字货币可以像传统货币一样用于买卖商品,只是它是数字的,没有实物表示。加密货币是数字货币的一个子集,具有保密性、分散性、安全性和加密性等独特特征。比特币和以太都是加密货币,它们的价值都有所增长。除了数字货币和加密货币,还有新的金融交易数字方法,使用户只需一个电子邮件地址或指纹就可以即时兑换货币但是公民和经济分析师都对加密货币安全性感到担忧。另一方面,加密货币的流行在很大程度上是因为它背离了传统的过度限制性的安全和债务措施,这些措施依赖于大银行和政府的监管。
一些专家认为,一种像区块链一样具有内部安全性的通用、分散、数字货币可以通过消除资金流动的障碍来提高市场效率。在大多数公民没有银行账户、无法投资于地区或全球金融市场的国家,这一点尤为重要。然而,一些政府认为,对这些货币缺乏监管以及它们的匿名性风险太高,因为它们很容易被用于非法交易,比如避税或购买非法商品。其他人认为,安全的数字货币提供了一种更方便、更安全的金融交易形式。例如,一种普遍接受的货币将使真正的全球金融市场成为可能,并将保护个人资产免受地区性通胀波动和地区政府人为操纵货币的影响。如果替代数字系统变得更加成熟,数字货币将如何影响当前的银行系统和以国家为基础的货币,将会有很多问题。
您的政策建模团队已受雇于国际货币营销(ICM)联盟,帮助他们确定全球分散的数字金融市场的可行性和影响。ICM联盟要求您构建一个能够充分代表这类金融体系的模型,确保在个人、国家和全球层面确定限制或促进其增长、准入、安全和稳定的关键因素。这要求你考虑各国的不同需求,以及它们与这个新的金融市场合作的意愿,并修改它们目前的银行和货币模式。这可能要求他们放弃自己的货币,也可能不要求他们放弃自己的货币,因此这增加了市场模型的复杂性。您不是要选择现有的数字货币,而是要讨论通用数字货币的采用策略和实施中的问题。你还应该包括对这样一种全球数字货币的监管机制。ICM联盟要求您扩展您的分析范围,以考虑这样一个系统对当前银行业、本地、地区和世界经济以及国家间国际关系的长期影响。
问题解读:这道题目是在数字货币的流通安全性背景下提出的,首先需要构建一个考虑数字货币的模型,该模型应该充分阐明这一金融体系。第二,需要确定全球分散的数字金融市场的可行性和影响,并开发一种通用的数字货币。并且确定在个人、国家和全球层面限制或促进其增长、访问、安全和稳定的主要因素。同时,这些国家将如何根据不同的需求、与新的金融市场合作的意愿来修改现有的银行和货币模式?这些修改的后果是什么?然后,分析这一体系对当前银行业、当地、地区和世界经济以及国家间国际关系的长期影响。还需回答如果这些国家放弃自己的货币,只使用数字货币,会发生什么?
优秀论文Team#1904381对这道题目的做法值的学习和借鉴。首先建立一个虚拟国家,其中央银行发行新的数字货币。数字货币对当前银行体系和宏观经济体系的影响取决于现实世界中与特定国家的经济互动。然后讨论一个国家将选择的两种不同的汇率制度。通过理论分析和R检验,我们发现,在引入数字货币的过程中,如果实施适当的政策,任何一种制度都能实现内外均衡,实现经济目标。该模型的创新之处在于引入了国际资本流动(ICF)参数。该文从理论和实证两个方面分析了国际金融危机对我国经济的影响。发现去中心化的数字货币不仅可以通过消除货币流动的障碍来更有效地运行经济,还可以通过数字货币的超高流动性来提升世界的福利。
并且全文的图表大部分是经济学相关的曲线图,截取了其中一张放在下方。如图所示,LM曲线上方的点表示国家的货币需求不足,而曲线以下的点表示货币需求过大。
图源:Team#1904381 Figure 1
F题使用的模型侧重综合评价和决策方法,也需要一些规划类问题的模型。在建模方法的选择上主要有:层次分析法,将一个复杂的多目标决策问题作为一个系统,将目标分解为多个目标或准则,进而分解为多指标(或准则、约束)的若干层次,通过定性指标模糊量化方法算出层次单排序(权数)和总排序,以作为目标(多指标)、多方案优化决策的系统方法。如果政策中存在多种因素,即可用层次分析法来分出各种因素的重要程度;概率论与数理统计,若制定政策的结果中涉及到政策实行后的效果分析,则会用到动态演化模型对实行后的数据变化进行监控。可以用一些差分方程或常微分方程表示,一方面能够预测监控数据随时间的变化,另一方面能够解释一些状态;博弈论,主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。
总的来说,美赛ICM的题目背景知识更加丰富,交叉学科的特点非常突出。D题一般为运筹学或网络科学(operations research/network science),需要准备的算法、软件包括可视化的软件都很多,注意网络关系图、图论规划优化问题。E题是环境科学题(sustainability),大体上会集中在环境污染、资源短缺、可持续发展、生态保护等几个方面,评价类预测类问题居多,上手较为容易,但考验队伍的建模分析功力以及不能硬生生地套用模型。F题是政策研究题(policy),经济政治的背景题目,考验数据分析能力以及结果分析的结论要有一定的深度。特别是EF题的数据一般需要自己搜集,大家平时多注意外网数据库的积累和收藏。相信不论是MCM,或是ICM,只要大家找准队伍能力定位、了解六道题目的特点风格,正确合理的做好准备,相信大家都能顺利完成美赛之旅!