2019第十二届“认证杯”数学建模（第一阶段）

选的B题

第一阶段赛题下载：https://www.lanzous.com/i3vnsvg

建立了两个模型，一个字典搜寻算法选择模型，一个算法优化模型。

问题假设

1.假设文本随机生成
2.假设构成文字的20个字母为a~t
3.假设替换错误只出现片段的首尾，因此我们搜寻的片段长度就为11~21之间

模型准备

使用C++随机数引擎与分布类型生成文本，每段长度随机5000~8000。
调整文本（随机生成的文本找到11~21个字母相同的基本没有）

选择模型

使用了BF，动态规划，KMP三种方法，直接跑程序搜寻相同字符串，搜寻结果保存为txt文件，同时记录运行时间，占用内存，资源使用量，初步比较效率。
选择改变每段文本长度，再次记录上面三个记录，统计制表做附件，绘图插论文，使用MATLAB拟合数据，得到方程式，绘制方程式相关三维图像。
比较得出KMP为最优算法。

优化模型

优化KMP的next数组，字符不匹配时，next数组会出现character[i]=character[next[i-1]];的迭代查询，使用next[i]=next[next[i-1]];归并相同数据。
再次选择第一个模型的测试文本，测试程序的运行时间与占用内存，与传统KMP算法比较。

程序时间大概也就是100秒~200秒左右，占用内存好像是150MB~300MB左右。

方法很简单，思路也比较清晰，但这道题难点在于模型和相关方程式的建立，这道题附件我们给的倒是挺多，附录就给了核心代码。

第一阶段代码下载：点击下载

posted @ 2019-04-23 10:10 Hk_Mayfly 阅读(1542) 评论(2) 收藏举报

刷新页面返回顶部