DeepSeek × 时间序列 :DeepSeek-TS,基于状态空间增强MLA与GRPO的时序预测新框架
本文介绍 DeepSeek-TS,该框架受到 DeepSeek 中高效的多头潜在注意力(MLA)和群组相对策略优化(GRPO)技术的启发,并将其应用于多产品时间序列预测。
这个的方法扩展了 MLA,提出了 MLA-Mamba。MLA-Mamba 允许潜在特征通过具有非线性激活的状态空间模型动态演变,为模型提供自适应记忆,使其能够适应趋势变化。
同时通过GRPO 引入了一种智能决策过程,将预测与基准进行比较来持续改进预测。这种动态调整有助于模型有效响应销售模式的突变。
本文将 DeepSeek-TS 框架与经典的 ARMA 模型和标准的基于 GRU 的网络进行了比较。结果表明,DeepSeek-TS 能够建模复杂的产品间关系并适应非线性动态,从而产生更准确和稳健的预测。
在接下来的章节中,我们将详细介绍 MLA 的扩展(MLA-Mamba)和 GRPO 框架的技术细节,并展示它们的协同作用如何增强多产品时间序列预测。
https://avoid.overfit.cn/post/73d492acd3dc4bb6b1def7b3d9a94572