数学建模美赛 F 奖经验分享
国际大学生数学建模竞赛 F 奖 经验分享
先介绍一下本人的BG:获奖的时候大二,之前参与过软件开发,并参与多个教育部认证软件设计大赛,有后端开发经验,对于本人影响最大的一段软件开发经历是AI plus 的软件,类似于 AI+教育,也获得了一些省部级以上的奖项,后面就一直在人工智能的道路上越走越远,好久没有再碰后端,目前发表了一篇 PMLR 独立出版的 EI 会议论文,强化学习鲁棒性优化方向课题,目前是在从事强化学习+无人驾驶与计算机视觉方面的研究,第一作者的工作标准,我觉得我的科研经历对我的美赛帮助非常大,也希望讲一讲我是如何以做科研的视角理解美赛
1. 选题
由于我的两位队友之前都没有过美赛的经验,我之前(大一的时候)有过两段失败的数学建模经验,所以我也算是最有经验的,因此选题大概是我主导的,我一开始就决定要选 C 题,因为我有在做机器学习相关的科研,会比较顺手(优势在我),于是我们选C题,没有再多考虑,为什么去年没选C题,因为当时给了我好几个表格,给我吓死了,当时大一,第一次打这种比赛,难免心生恐惧,后面听说其实没我想象的这么难,那些数据看懂了就好了,确实是这样,我去年选B题 最头疼的就是,数据找不到,方法找不到,草草结束比赛,就没获奖,C 题多好,需要自己找的数据不多,C 题的数据分析我觉得是最重要的一环,我下面会讲。
2. 分析题目
首先就是分析题目了,很重要,要知道题目要求我们做什么,现在都有 AI 了,用不用大家肯定都心知肚明,合理借助 AI 工具提高解题效率是很重要的一环,但是完全借助 AI 没有自己的思考,大概率无法获奖。
如图所示: 直接就能把题目深度思考,分析出来,这一步大概就是,让咱们知道大概是怎么个题目

2.1 第一问的分析

拿到题目第一眼,我就看出来,很显然,这是一个预测模型,而且要对模型做出评估,还要分析相关性。对于数学建模小白来说,刚开始看到这些题目肯定会一头雾水,我第一次数学建模的时候,其实是有入门一些数学建模常见基础知识的,这里不作推荐,可以去bilibiili 等平台自行搜索。预测问题,很多啊,可以网上自行搜索,文献调研一下,或者其他手段搜索出符合条件的预测模型,什么机器学习啊,深度学习啊,或者传统数学方法,第二个,小白可能不知道预测模型啥意思,也可以自己去查一查,如图所示:(或者AI 一下)

然后咱们就已经知道什么是预测模型了,既然是预测,那么肯定需要现有数据的铺垫,想要求快的话,把数据都喂给AI 问问 AI 比赛方都给了什么数据,然后心里就有底了 如图:

2.2 数据分析思考1:这个数据是最庞大的,细化到了每个运动员身上,而奥运会取得奖牌的核心不就是运动员吗,那初步思考就是,如何来衡量运动员对奥运会的影响,比如说,想想这个运动员后面还会参加吗,这个国家还会有几个这样的运动员呢,这个运动员如果还参加的话,有希望夺得金牌吗

2.3 数据分析思考2:既然是预测问题,那么是不是可以根据以往的金牌,来预测未来的金牌呢,那么根据以往的金牌数量,来预测未来的奖牌,要用什么模型呢?(对于有数学建模经验的同学来说,答案呼之欲出)

2.4 数据分析思考3:爱看奥运会的,有了解的人,很多肯定都觉得,主办方会有优势,那么既然赛方给了我们主办方数据,我们刚好就可以拿主办方数据来验证这样的猜想,可以引入到我们的预测模型中,看看主办方会不会影响比赛结果

2.5 数据分析思考5:可以从出题方的角度思考一下,为什么要给这样的项目设置,我们的问题是要了解未来奥运的情况,那项目设置肯定也是很重要的一环,通俗易懂点说,比如今年的项目设置, A 国家的强项有很多,是不是更容易就获奖了。

回到2.1 还有一些什么关联性分析,就是探讨哪些项目对于国家很重要,其实有很多现成的关联性分析方法,可以自行搜索
第一大题解题
大题干 :为每个国家的奖牌数(至少包括金牌数和奖牌总数)建立一个模型。包括对模型预测不确定性的估计/精度以及衡量模型表现的指标。
1.1
-
题干:根据您的模型,您对 2028 年美国洛杉矶夏季奥运会奖牌榜的预测结果是什么?请给出所有结果的预测区间。
-
我想到什么:哦,这是个预测模型,让我去预测2028年的结果,什么意思,就是预测当时的奖牌数量呗,然后我第一个想到的就是说,有没有什么比较好的预测算法,如果是数模小白想不出来也没关系,但一定要想到一点,我应该怎么预测?这时候,就可以去问问 AI ,有哪些预测算法,然后举几个例子,什么 随机森林,什么 LSTM ,Arima 等等等等.
打比方,你是个小白在打比赛,对于模型啥的一窍不通,那就可以问问看了,像我这样,很简单的。打比方,你是个小白在打比赛,对于模型啥的一窍不通,那就可以问问看了,像我这样,很简单的。

然后,AI 还告诉我们要参考哪些指标嘞,那挺好的,不过有些指标其实赛题官方已经给好了,我们用就是了,优先使用

首先就是 AI 有给到一个机器学习模型,我当时有用到一个随机森林,然后就是说,不要 AI 给了什么你就用什么,因为别人也可以问 AI,也可以用跟你一样的模型,那要怎么办呢,首先我先传授第一条突围秘诀,了解清楚这个模型,要怎么了解清楚呢,你要能够跟评委说明白,我为什么要用这个模型,而不是其他模型,这一步就体现了你自己的思考,对于当时的处就是可以结合多个指标去预测嘛,这样就不怎么会被怀疑套用 AI 给的模型(其实也可以问 AI 为什么使用随机森林很合理)

然后 AI 还有给到一个时序模型,小白应该有些会不熟悉的,反正结合 AI 给出的回答,大概知道可以沿着一条时间线,通过过去的结果预测未来的结果,然后 AI 是有给了 Arima 模型还有 指数平滑法,我的建议还是,不要立刻直接用,去了解清楚,哪个更合适,然后给评委论证清楚你使用的理由,就是要有合理性,因为既然是不同的算法,肯定是各有所长。

好啦,以上就是和 AI 对线出来的结果,核心思想就是,就算给了模型,也不要直接用,可以考虑一下适用场景,哪个模型更加适用赛题的场景,为什么(模型的 XX 特点)。
后续会继续更新,得到备选模型之后,如何将其包装为自己的模型,就像是做科研一样的
浙公网安备 33010602011771号