【IoTDB 社区】白话时序大模型系列-3:一个函数,三个场景,看透本质
前两篇文章,我们聊了“什么是时序大模型”以及它和“机理模型”的优先级。今天,我们来“祛魅”,把时序大模型到底怎么用的,用一个函数和三个场景讲明白。
时序大模型,本质就是一个函数,一个方法。
这个函数的核心作用很简单:预测时间序列的未来数值。
是函数,就有输入和输出。一旦你掌握了它吃什么、吐什么,它在你眼里就不再神秘。
时序大模型的输入是时间序列,输出也同样是时间序列。
下面,我们通过三个典型的场景,来具象化地看看这个“函数”到底是如何工作的。
场景一:单变量预测,最朴素的“以史鉴今”
这是最基础的场景,就像看着后视镜开车。
-
输入:一条时间序列的一段历史数值。
-
输出:这条时间序列的一段未来数值。

在这个场景中,我们只关注一条时间序列(即一个变量),叫目标变量。模型只从它自己的过去,学习它的规律,并预测它的未来。
一个典型的例子就是温度预测。比如,你根据一个房间过去24小时每小时的室内温度记录,来直接预测未来6小时的温度走势。这里没有任何其他信息,模型唯一能依靠的,就是温度序列本身的历史趋势、周期性和波动性。
场景二:多变量预测,引入相关因素的历史数据
现实世界更复杂。一个变量的走势,往往不止由自己的过去决定。
-
输入:多条时间序列的一段历史数值。
-
输出:一条时间序列(目标变量)的一段未来数值。

在这里,输入中除了目标变量本身的历史,还加入了其他相关变量的历史,这些变量被称为协变量。模型会尝试学习协变量的历史变化,是如何影响目标变量的。
比如,预测一个城市的交通拥堵指数。输入就不应只是拥堵指数的历史数据,还应包括过去时段的降雨量、是否节假日、是否有大型活动等协变量的历史序列。因为暴雨或演唱会,会显著改变未来的交通状况。模型能从中学到“下雨天晚高峰拥堵指数会飙升”这样的关联模式。
场景三:增强预测,再引入协变量的未来数据
这是最强大也最贴近实战的场景。它用到了“预知未来”的能力,当然,这个“未来”是部分已知的。
-
输入:多条时间序列的一段历史数值 + 一些协变量的未来数值。
-
输出:一条时间序列(目标变量)的一段未来数值。

这个场景的精髓在于:目标变量本身很难预测,但有些影响它的协变量,其未来值是已知的或可以被精准预测的。把这些已知的协变量的未来数值喂给模型,能极大地提升预测准确性。
最经典的例子是电力负荷预测。我们要预测未来的用电量(目标变量)。输入不仅包括历史用电量和历史气温,更关键的是,我们拥有未来气温的天气预报!天气预报就是最重要的“协变量的未来数据”。模型可以结合历史规律和已知的“明天会升温”这个未来信息,更精准地推算出空调负荷的激增。
总结
时序大模型的使用方式非常清晰:
-
场景一,只看自己的过去。
-
场景二,还看了相关因素的过去。
-
场景三,更进一步,还参考了相关因素已知的未来。
这三个场景,就是时序大模型核心预测能力的展示。它就是这样一个聪明的函数,能够灵活地整合不同维度的历史与未来信息,为我们描绘出关于未来的趋势。

我们通过三个典型的场景,来具象化地看看时序大模型这个“函数”到底是如何工作的。
浙公网安备 33010602011771号