现有时间序列基础模型(TSFM)如 Timer、MOIRAI 等通过大规模多源预训练构建模型,但存在以下痛点:
- 参数规模庞大:动辄数十亿参数(如 Time-MoE 含 4.53 亿参数),计算成本高,难以部署于资源受限场景。
- 泛化能力依赖数据规模:固定分块(Fixed Tokenization)无法处理不同尺度(如分钟级 / 小时级采样)和内在周期(如日 / 周周期性),导致跨数据集迁移时性能下降。
-
Periodical Tokenization(周期性分块)
- 自适应分块:根据时间序列的内在周期(如日周期、周周期)动态分割序列,确保每个分块包含完整周期。例如,日周期数据在小时级采样下分块长度为 24,在 15 分钟采样下分块长度为 96,保证不同尺度下周期模式的一致性。
- Flex Projection Layer:通过矩阵伪逆(Moore-Penrose inverse)动态调整分块嵌入权重,解决不同分块长度下的语义对齐问题,避免固定投影导致的特征失真。
-
Periodical Parallel Decoding(周期性并行解码)
- 非自回归预测:利用编码器最后一个 token(含历史周期信息)作为解码器输入,并行生成多步预测,避免自回归解码的误差累积,同时提升推理效率。
- 权重衰减机制:对预测 tokens 应用指数衰减权重 ω(τ)=1/eτ,弱化长序列预测时历史信息的衰减影响。
-
轻量化架构
- 通过上述技术充分利用时序数据的周期归纳偏置,模型参数仅 130 万(LightGTS-tiny)至 400 万(LightGTS-mini),较同类 TSFM 缩小 10-100 倍,同时保持零样本和全样本预测性能领先。
- 预测精度:在 9 个真实数据集(如 ETT、Traffic、Electricity)上,LightGTS-mini 的零样本 MSE 较 MOIRAI 降低 28%,较 Time-MoE 降低 17%,全样本性能也优于 PDF、iTransformer 等模型。
- 效率提升:参数数量和计算量(MACs)较 Timer、Chronos 等减少 10 倍以上,推理时间缩短至 0.01 秒,适合实时部署。
- 鲁棒性:在不同采样粒度(如 ETT1 的 1 小时 vs. ETT2 的 15 分钟)下,LightGTS 的 MSE 波动小于 0.05,而传统模型波动超过 0.2,证明其对尺度变化的适应性。
- 多尺度周期性:股票存在日内(分钟级)、日线(日周期)、周线(5 日周期)等多层周期,且受市场情绪、宏观经济影响呈现非平稳性。
- 高噪声与非线性:收益率序列包含大量短期波动,传统模型易过拟合。
- 实时性需求:高频交易场景要求低延迟预测,大规模参数模型难以满足。
-
数据预处理与周期识别
- 多尺度周期提取:
- 利用 Fast Fourier Transform(FFT)或领域知识识别核心周期:
- 日线数据:日周期(5 交易日 / 周)、周周期(20 交易日 / 月);
- 分钟级数据:日内周期(如 4 小时交易时段)、半日周期(240 分钟)。
- 示例代码(伪代码):
- 特征工程:
- 融合技术指标(如 MACD、RSI)、成交量、大盘指数等作为多变量输入。
-
模型配置与训练
- 分块与投影设置:
- 参考 patch size P∗=48(论文默认值),根据股票周期动态调整分块长度:
- 日线数据:周期 P=5(交易日),分块为 5 个样本 / 块;
- 分钟级数据:周期 P=240(4 小时),分块为 240 个样本 / 块。
- 使用 Flex Projection Layer 动态适配不同周期下的嵌入维度,避免尺度变化导致的特征失配。
- 预训练与微调策略:
- 多源金融数据预训练:利用外汇、期货、指数等多品类数据预训练模型,捕捉金融市场共性周期模式;
- 目标股票微调:在特定股票数据上微调时,采用小学习率(1e−5)和早停策略,避免过拟合。
-
预测与优化
- 并行解码多步预测:
- 设定预测 horizon F=20(如未来 20 个交易日),通过 Periodical Parallel Decoding 一次性生成多步收益率预测,减少自回归误差累积。
- 风险控制增强:
- 结合波动率估计(如 GARCH 模型)调整预测置信区间,或引入注意力机制聚焦关键事件(如财报发布日)的特征。
- 结合市场状态切换:引入隐马尔可夫模型(HMM)识别牛熊市场状态,动态调整周期权重。
- 高频交易场景适配:针对分钟级数据,优化分块粒度(如以 15 分钟为基本周期),并加入订单簿数据作为输入。
- 零样本迁移应用:利用论文中零样本优势,在新上市股票或新兴市场数据缺乏时,直接基于预训练模型预测,减少数据标注成本。
LightGTS 通过周期性建模与轻量化设计,为金融股票预测提供了高效解决方案:其自适应分块能力适配多尺度周期,并行解码提升实时性,且参数规模小易部署。在实际应用中,需结合金融数据特性优化周期识别与特征工程,进一步提升模型对市场波动的鲁棒性