数学建模(1)#boom课程笔记

1-0

论文写作 matlab入门 数据预处理 公示编辑 图与表格 画图 常见函数 编程语法 函数与脚本

赛题: 优化类 预测类 评价决策类 NP-hard类

优化类:最优最短最合适,线性规划,非线性规划,最短路径,最小生成树,动态规划

预测类:短/长期和周期,灰色预测,时间序列,回归分析,支持向量机,神经网络预测,马尔科夫链

评价决策类:孰优孰劣,层次分析,topsis法,灰色关联分析,模糊综合分析,主成分分析,聚类分析

NP-hard类:无法求最优解,蚁群算法,粒子群算法,遗传算法,模拟退火

1-1赛前准备

生成了md5码之后,不能再碰文件

abc三道题选择一个,获奖率0.698%,二等奖2.87%

软件安装和队友同一版本

软件:

Mathpix:截图即可获得公示编辑

AxGlyph:学术绘图,比MATLAB和excle高效

其他

  1. 规律作息,赛前不熬夜
  2. 找好场地,最好能保证周六通宵

找能够说话讨论的地方,确保有插座.充电器

  1. 若比赛期间有私事,体现和队友协商好

避免个人私事影响团队合作.周五的课,能尽量请假就尽量请假

  1. 放低心态

赛题选择

·A题偏向物理、工程类

专业性较强,往往有标准答案,非本专业不建议选择

需要根据物理定理使用微分方程和偏微分方程模型

神经网络,遗传算法等求解较优解的启发式算法一般不适用

热力学等物理题可以先建立一个非常简陋的模型,再根据题目中的要求,一点一点的改进

·B题由于近两年改革,题型不定,19年物理类,20年运筹优化类

·C题偏向经管,运筹,统计,数据分析类

赛题较开放易读懂,运筹优化类问题一般没有严格最优解,结果合理即可,数据往往需要自己找

万一做到一半发现做不出来,即使瞎编也要编完一整篇论文交上去

搜索技巧:

·完全匹配搜索:查询词的外边加上双引号“”

引号中英文都可,例如搜索“CT参数标定”,得到的结果不是分别带有“CT”或“参数标定”的网页

·标题必包含关键词:查询词前加上intitle:

冒号为英文输入下的

例如搜索intitle:CT参数标定,则搜索结果里每一个标题都会带有“CT参数标定”

·搜索文档:例如查询词后空格再输入福filetype:文件格式(doc/pdf/xls等等)

例如搜索:线性规划filetype:pdf

得到的就是pdf版的资料

·去掉不想要的:查询词后面加空格后加减号与关键词

例如搜索后不想看百度文库的东西,搜索 线性规划 filetype:pdf -百度文库

知网

·先看知网的硕博士论文

硕博论文会对研究的问题有详细的背景和基础知识介绍,可以帮助我们快速理解题目

按照被引顺序

·高级检索:想了解神经网络在信贷策略中的应用,想找一些相关的硕博论文

  1. 进入高级检索界面,+和-可以自定义增加和减少检索字段
  2. 主题为:企业信贷
  3. Or主题为:信贷决策
  4. And关键词:神经网络,词频设置为”模糊”.模糊是输入的检索词在检索结果中出现即可,子序,字间间隔可以产生变化.
  5. 检索结果可按”相关度’’或者”被引”排序

去哪找数据

查数据平台

优先在知网/谷歌学术平台搜索

·国家统计局

其他国家部门网站大多都有数据分页,如果需要可另行查找

·awesome-public-datasets

Github上的一个项目,包含了经济,地理,能源,等所有领域的数据

·EPSDATA平台

收费

其他:国家信息中心,kaggle,和鲸社区

1-6数据预处理

缺失值

·比赛提供的数据,发现有些单元格是null或空的

·缺失过多:例如调查人口信息,发现“年龄”这一项缺失了40%,就直接把该项目指标删除

·最简单处理:均值、众数插补

 ·定量数据,例如关于一群人的身高、年龄等数据,用整体的均值来补缺失

 ·定性数据,例如关于一群人的性别、文化程度;某些事件调查的满意度,用出现次数最多的值来补缺失

·适用赛题:人口的数量年龄,经济产业情况等统计数据,对个体精度要求不大的数据

·Newton插值法

根据固定公示,构造近似函数,补上缺失值,普遍适用性强

缺点:区间边缘处的不稳定振荡,即龙格现象(什么是龙格现象(Runge phenomenon)?如何避免龙格现象?_图灵的猫.的博客-CSDN博客)。不适合对导数有要求的题目

适用赛题:热力学温度、地形测量、定位等只追求函数值精准而不关心变化的数据。

·样条插值法

·用分段光滑的曲线去插值,光滑意味着曲线不仅连续,还要有连续的曲率。

·适用赛题:零件加工,水库水流量,图像“基线漂移”,机器人轨迹等精度要求高、没有突变都是数据

异常值

·样本中明显和其他数值差异很大的数据,例如一群人的身高数据中有个32

·正态分布3σ原则

·数值分布在(μ-3σ,μ+3σ)中的概率为99.73%,其中μ为平均值,σ为标准差

求解步骤:

1、计算均值u,和标准差σ

2、判断每个数据值是否在(μ-3σ,μ+3σ)内,不在则为异常值

适用题目:总体符合正态分布,例如人口数据、测量误差、生产加工质量、考试成绩等

不适用题目:总体符合其他分布,例如公交站人数排队论符合泊松分布

 

箱型图

 

把数据从小到大排序

1-7究竟怎么建模

到底什么是模型

有理论基础

有推导过程

有最终结论

以文字描述,数学公式,图像表格展现出来

建模过程

·一篇完整的数模论文

 包括摘要(最重要)、问题重述、模型假设和符号说明、模型建立与求解(最长)、模型的优缺点与改进方法、参考文献和附录

·摘要:最重要

·读者看完摘要,就知道论文研究的问题、用了什么方法、求得了什么结果,以及每一部分的大致步骤。

·问题重述

·将题目简述一遍即可,并不重要。注意不要复制粘贴,避免查重

·模型假设和符号说明

·好的假设能让你事半功倍

·例如某一年太阳投影问题,影子长度与地球公转也有关系,但地球公转对影长的影响远远小于自转,可在模型假设里说明“忽略公转对影长的影响”

·符号说明将论文中定义的重要符号列出表格说明即可

·模型的建立

一组公式,和对公式中每个变量的解释,就是一个模型

先查阅资料,看着资料,用自己的话复述一个简单的模型,再根据题目中的约束条件去一步步修改模型,把题目中的变量带入模型中去

·不同小问

并不是针对题目的每一问都要建立一个模型,如果每一问之间具有相似性、仅仅是增加了约束条件的话,完全可以全文建立一个模型,再针对每一小问进行模型改进。

·模型的优缺点与改进方法

  这一部分不是必须的!结合查到的文献,分析征文中模型常用在什么哪种问题,又与本文所求解的问题有何区别

·参考文献

  ·

 

·附录

·附录里要写出正文中求解时用到的代码

一定不要把网上搜到的代码直接复制粘贴

把查到的代码里变量名换一换就不会被查重

曾出现过参加国赛,再省内被推到国奖,但查重发现代码是复制的,结果被取消获奖并官网通报的先例

2-1论文整体排版

·各级标题与正文层次分明

·一般标题级别不超过三级

        ·正文中文字体设置宋体,英文Times New Roman

·正文排版紧凑,看起来充实,没有大片空白

·避免图片过大导致出现大片空白,且不要留有空行

·表格与图片

·表格用标准的三线表

·表的标题放在表的上方,图名放在图的下方

·公式编辑

·推荐mathpix,或用word的公式编辑器

·公式需要解释清楚每个变量的意义;重要的公式后面带有编号

2-2标题怎么写

·读完标题,就能知道本文建的是什么模型

·简明扼要、符合规范、便于检索

·尽量使用大家都知道的词语

   ·避免出现公式、非公知公用的缩写

   ·字数限制在一行内

   ·基于xxx模型/算法的xxx问题研究

·xxx模型就是正文里的核心模型

Xxx问题就是赛题的中心词

不要过多使用修饰词

Example

基于一维热传导方程的炉温曲线机理问题研究

基于单目标优化模型的CT系统成像问题研究

基于多目标优化模型的系泊系统问题研究

基于动态规划补贴的出租车资源匹配问题研究

基于差分方程和元胞自动机的交通阻塞问题研究

基于回归分析的长江水质预测问题研究

2-2摘要怎么写

·基本要求

·摘要是对论文的概括总结

·让评阅老师读完摘要,就知道本文解决的问题

建立的模型和求解结果。

·注意事项

·不要加图或表格

·控制在3/4页到一页,字数大约800~1100

开头段:开头段模板:本文主要研究了XXX问题。根据XXX,利用XXX

模型/方法,求解出XXX

·第一句:说清研究的问题

·第二句:说清全文采用的模型/算法、采取的操作

·开头段不要写详细的求解结果

示例:17年国赛A

本文主要研究了CT系统参数标定与成像问题。根据CT系统成像原理,利

radon变换、傅立叶变换等方法,对CT系统进行参数标定,完成了未知

介质的成像并进行了去噪处理,最后分析了参数标定的精度和稳定性并

设计了新的用于参数标定的模板。

 

 

针对问题一,考虑XXX,…,建立XXX模型/利用XXX方法,…求解出XXX

中间段模板:针对问题一,考虑/根据XXX,…,建立XXX

模型/利用XXX方法,...求解出XXX

一定要写清结果!!!

·优化类、预测类和物理类的题目,要明确写清数值

·要求提供建议或评价的题目,写要明确写清结论和数据依据,但不

要有表格;数据过多可说明数据见附录

示例:17年国赛A

针对问题二和问题三,根据数字图像处理技术和滤波器原理,利用不同空

域特征的区域对应着频率平面中的不同区域的特点,在已知接收信息的情

况下,利用傅立叶变换即可求得被测物体的吸收率、性状和位置等信息。

根据CT系统正方形托盘的几何信息,可求得附件中10个点的位置对应的

收率,依次为-0.0757-0.0325-0.0380-0.00151.98270.0023

0.0131; 0.0125; -0.0204; 0.0297

 

针对问题二,考虑XXX,……,建立XXX模型/利用XXX方法,…求解出XXX

针对问题三,考虑XXX,….,建立XXX模型/利用XXX方法,..求解出XXX

总结:总结全文,继而分析下你用的模型的优点,自夸一下。

·如果写完后摘要超过一页了,可以不写

·不要累赘重复前面写过的内容

·写一些本文的特色、自夸的语句

示例:17年国赛A

定价模型考虑了会员密集程度、任务集中度、任务难易程度等因素。任务优

化分配模型提高了任务的有效完成率,基于最大流的启发式算法计算精度高、

运算时间短等优点,高效解决了拍照任务定价问题。

示例:16年国赛B

本文的特色在于将机理分析与多目标规划相结合,运用熵权法将多目标问题转

化为单目标问题,使得求解结果更加客观。此外,对于解空间较复杂的模型,

设计了变步长搜索算法,在保证了求解的精度的同时,极大地提高了运算的时

间复杂程度,为日后系泊系统的设计的发展提供了参考依据。

 

关键词:主要模型/算法,或出现频率高的、体现论文针对的问题的词

·关键词一般4~6

·使用的模型和算法、大家都知道的专业名词、

问题的关键词

·中间以空格分开

示例:16年国赛A

系泊系统设计 多元非线性方程组 循环遍历法层次分析法优化模型

系泊系统设让 机理分析 最小二乘法变步长搜索算法

系泊系统设计 刚体力学方程组 多重搜索算法多目标优化

系泊系统设计 受力分析 悬链线控制模型多目标优化遗传算法

posted @ 2023-08-27 15:56  齐鲁师范学院-hzj  阅读(159)  评论(0)    收藏  举报