不规则时间序列论文整理2024-2025

按照时间的顺序进行整理,针对关键词会进行更加准确的标注

截止到2025年9月7日整理,如有遗漏欢迎补充

2025

[2505.11250] Rethinking Irregular Time Series Forecasting: A Simple yet Effective Baseline

August 11th

引用4

关键词:不规则时间序列预测,多元时间序列,补丁策略

不规则多元时间序列(IMTS)的预测是医疗保健和气候科学等领域的一项关键任务。然而,这项任务面临两个重大障碍:1)IMTS中固有的非均匀性和缺失数据使时间动力学的建模复杂化,2)现有方法通常依赖于计算成本高昂的架构。为了应对这些双重挑战,我们引入了APN,这是一种通用且高效的预测框架。APN的核心是一个新颖的时间感知补丁聚合(TAPA)模块,它引入了一种基于聚合的自适应补丁范式,超越了固定跨度分段和基于插值的方法的局限性。TAPA首先学习动态时间边界来定义数据驱动的片段。至关重要的是,它不是重新采样或插值,而是通过所有原始观测值的时间感知加权聚合直接计算补丁表示,其中权重由每个观测值与片段的时间相关性决定。这种方法提供了两个关键优势:它通过避免引入人工数据点来保持数据保真度,并通过设计确保完全的信息覆盖。由此产生的正则化和信息丰富的补丁表示允许使用轻量级查询模块进行历史上下文聚合,并使用简单的MLP进行最终预测。对多个真实世界数据集的广泛实验表明,APN建立了一种新的最先进的方法,在预测精度和计算效率方面都明显优于现有方法。

 

[2508.01971] Revitalizing Canonical Pre-Alignment for Irregular Multivariate Time Series Forecasting

Aug 4th

关键词:不规则时间序列预测,多元时间序列,补丁策略

不规则多元时间序列(IMTS)以不均匀采样和变量间异步为特征,为许多预测应用提供了动力,但有效建模仍然具有挑战性。规范预对齐(CPA)在IMTS建模中已被广泛采用,它在每个全局时间戳处填充零,从而减轻了变量间的异步性并统一了序列长度,但其密集的零填充会使预对齐的序列长度膨胀,特别是在存在大量变量的情况下,会导致过高的计算开销。最近使用补丁策略的基于图的模型避开了CPA,但它们的局部消息传递难以捕捉全局变量间的相关性。因此,我们假设应保留CPA,模型应正确处理预对齐序列,使其能够超越避开CPA的最先进的基于图的基线。从技术上讲,我们提出了KAFNet,这是一种基于CPA的紧凑架构,用于IMTS预测,它耦合了(1)用于序列平滑和稀疏性缓解的预卷积模块,(2)用于可学习压缩和序列内不规则性建模的时间核聚合模块,以及(3)用于频域中低成本序列间相关性建模的频率线性注意块。在多个IMTS数据集上的实验表明,KAFNet实现了最先进的预测性能,参数减少了7.2美元,训练推理加速了8.4美元。

 

[2506.18046] TAB: Unified Benchmarking of Time Series Anomaly Detection Methods

July 15th

引用7

code:decisionintelligence/TAB: [PVLDB 2025] TAB: Unified Benchmarking of Time Series Anomaly Detection Methods

关键词:时间序列异常检测

时间序列异常检测(TSAD)在金融、交通和医疗保健等许多领域发挥着重要作用。随着对现实的持续监测,将有更多的时间序列数据可用,这也导致了对TSAD的需求不断增长。虽然已经存在许多TSAD方法,但仍然需要新的更好的方法。然而,有效的进展取决于是否有可靠的方法来评估新方法并将其与现有方法进行比较。我们解决了当前与数据集、实验设置和方案相关的评估程序中的不足。具体来说,我们提出了一种新的时间序列异常检测基准,称为TAB。首先,TAB包括来自不同领域的29个公共多元数据集和1635个单变量时间序列,以促进对不同数据集的更全面评估。其次,TAB涵盖了各种TSAD方法,包括非学习、机器学习、深度学习、基于LLM和时间序列预训练方法。第三,TAB具有统一和自动化的评估管道,可以公平、轻松地评估TSAD方法。最后,我们使用TAB来评估现有的TSAD方法并报告结果,从而更深入地了解这些方法的性能。此外,所有数据集和代码都可以在https://github.com/decisionintelligence/TAB.

 

* ICML 25[2505.22815] IMTS is Worth Time $\times$ Channel Patches: Visual Masked Autoencoders for Irregular Multivariate Time Series Prediction

May 30th

code:WHU-HZY/VIMTS: The implementation of paper: IMTS is Worth Time × Channel Patches: Visual Masked Autoencoders for Irregular Multivariate Time Series Prediction, ICML 2025

关键词:不规则时间序列,多元时间序列,预测,时间模式捕获,视觉掩码自动编码

不规则多变量时间序列(IMTS)预测具有挑战性,因为多通道信号的不一致性和大量缺失数据的普遍存在。由于存在大量缺失值,现有方法难以从这些数据中捕获可靠的时间模式。虽然预训练的基础模型显示出解决这些挑战的潜力,但它们通常是为定期采样时间序列(RTS)设计的。受visual Mask AutoEncoder(MAE)对稀疏多通道信息建模的强大能力及其在RTS预测中的成功的启发,我们提出了VIMTS,这是一个将visual MAE应用于IMTS预测的框架。为了减轻缺失值的影响,VIMTS首先将IMTS沿时间线以相等的间隔处理成特征块。然后使用学习到的跨通道依赖关系来补充这些补丁。然后,它利用视觉MAE处理稀疏多通道数据以进行补丁重建的能力,然后采用从粗到细的技术从聚焦的上下文中生成精确的预测。此外,我们通过将视觉MAE适应IMTS数据,将自监督学习集成到改进的IMTS建模中。大量实验证明了VIMTS的卓越性能和少镜头能力,推动了视觉基础模型在更一般的时间序列任务中的应用。我们的代码可在https://github.com/WHU-HZY/VIMTS.

 

[2505.19193] Interpretable Graph Learning Over Sets of Temporally-Sparse Data

May 30th

关键词:医疗数据,不规则时间序列,预测,图混合加性模型GMAN

现实世界的医疗数据通常包括以不规则和异步时间间隔收集的多个信号的测量值。例如,不同类型的血液检测可以在不同的时间和频率进行测量,从而导致时间数据分散且不均匀。不同属性的不规则采样的类似问题也发生在其他领域,例如使用事件日志文件监控大型系统或在社交网络上传播假新闻。有效地从这些数据中学习需要能够处理时间稀疏和异构信号集的模型。本文提出了一种新的、可通过设计解释的图混合加性网络(GMAN),用于学习不规则的时间信号集。我们的方法在现实世界的医疗任务中实现了最先进的性能,包括与现有方法相比,住院死亡率预测的AUROC评分提高了4分。我们通过将GMAN应用于假新闻检测任务,进一步展示了GMAN的灵活性。我们展示了它的可解释性能力,包括节点级、图级和子集级的重要性,如何允许过渡阶段检测,并获得具有现实世界高风险影响的医学见解。最后,我们对GMAN表达能力提供了理论见解。

 

* ICML 25[2505.17431] HyperIMTS: Hypergraph Neural Network for Irregular Multivariate Time Series Forecasting

May 23rd

关键词:不规则时间序列,多元时间序列,预测,超图网络

不规则多元时间序列(IMTS)的特征是变量内的不规则时间间隔和变量间的不对齐观测,这给学习时间和变量依赖性带来了挑战。许多现有的IMTS模型要么要求填充样本与时间和变量维度分开学习,要么通过二分图或集合表示原始样本。然而,前一种方法通常需要处理影响效率和破坏原始采样模式的额外填充值,而后一种方法在捕获未对齐观测值之间的依赖关系方面存在局限性。为了以统一的形式表示和学习原始观测中的两种依赖关系,我们提出了HyperIMTS,这是一种用于不规则多元时间序列预测的Hypergraph神经网络。观测值被转换为超图中的节点,通过时间和变量超边相互连接,以实现所有观测值之间的消息传递。通过感知不规则性的消息传递,HyperIMTS以时间自适应的方式捕获变量依赖关系,以实现准确的预测。实验证明,HyperIMTS在IMTS预测的最先进模型中具有竞争力,计算成本低。

 

[2505.04167] STRGCN: Capturing Asynchronous Spatio-Temporal Dependencies for Irregular Multivariate Time Series Forecasting

May 7th

关键词:不规则多元时间序列,预测,时空关系图

不规则多元时间序列(IMTS)在许多领域的实际应用中很普遍,其中不同的传感器频率和异步测量带来了重大的建模挑战。现有的解决方案通常依赖于预对齐策略来规范数据,这可能会扭曲内在模式并增加计算和内存需求。为了解决这些局限性,我们引入了STRGCN,这是一种时空关系图卷积网络,它避免了预对齐,并通过将IMTS中的复杂相互依赖关系表示为全连接图来直接捕获它们。每个观测值都表示为一个节点,使模型能够通过映射所有节点间关系来有效地处理未对齐的时间戳,从而忠实地保留数据的异步特性。此外,我们用分层的“三明治”结构增强了这个模型,该结构战略性地聚合节点以优化图嵌入,在保持详细的局部和全局上下文的同时减少了计算开销。在四个公共数据集上进行的广泛实验表明,STRGCN实现了最先进的准确性、有竞争力的内存使用和训练速度。

 

[2505.00590] Unlocking the Potential of Linear Networks for Irregular Multivariate Time Series Forecasting

May 1st

关键词:不规则多元时间序列,动态权重调整,线性网络,Transformer

时间序列预测在金融、交通、能源、医疗保健和气候等各个行业都具有重要意义。尽管线性网络因其低计算成本和建模时间依赖性的有效性而被广泛使用,但大多数现有研究都集中在定期采样和完全观测的多元时间序列上。然而,在实践中,我们经常遇到以可变采样间隔和缺失值为特征的不规则多元时间序列。此类数据中固有的序列内不一致性和序列间异步性阻碍了依赖静态权重的传统线性网络的有效建模和预测。为了应对这些挑战,本文介绍了一种名为AiT的新模型。AiT利用能够根据观测时间点动态调整权重的自适应线性网络来解决序列内的不一致性,从而提高了时间依赖性建模的准确性。此外,通过在变量语义嵌入中结合Transformer模块,AiT有效地捕获了变量相关性,避免了系列间异步的挑战。四个基准数据集的综合实验证明了AiT的优越性,与现有的最先进方法相比,AiT的预测精度提高了11%,运行时间缩短了52%。

 

[2502.11816] IMTS-Mixer: Mixer-Networks for Irregular Multivariate Time Series Forecasting

Feb 17th

引用1

关键词:不规则多元时间序列,Mixer模型

预测不规则多元时间序列(IMTS)最近已成为一个独特的研究领域,需要专门的模型来解决其独特的挑战。虽然大多数预测文献都假设有规律的观测间隔,没有遗漏值,但许多现实世界的数据集,特别是在医疗保健、气候研究和生物力学方面,都违反了这些假设。时间序列(TS)混合器模型在常规多元时间序列预测中取得了显著成功。然而,由于需要完整且均匀间隔的观测,它们仍然没有被用于IMTS。为了弥合这一差距,我们引入了IMTS Mixer,这是一种专门为IMTS设计的新型预测架构。我们的方法保留了TS混合器模型的核心原理,同时引入了将IMTS转换为固定大小矩阵表示的创新方法,使其能够与混合器模块无缝集成。我们在来自不同领域的四个真实世界数据集的基准上评估IMTS Mixer。我们的结果表明,IMTS Mixer在提高预测精度的同时,也提高了计算效率。

 

2024

* ICML 24Irregular Multivariate Time Series Forecasting: A Transformable Patching Graph Neural Networks Approach | OpenReview

引用11

关键词:补丁,图神经网络,不规则多元时间序列

本研究提出了可转换补丁图神经网络(T-P ATCH GNN),它将每个单变量不规则时间序列转换为一系列可转换补丁,这些补丁包含不同数量的观测值,具有统一的时间分辨率,无缝地促进了局部语义捕获和时间序列间相关性建模,同时避免了对齐IMTS中的序列长度爆炸。

 

[2408.08328] Unleashing The Power of Pre-Trained Language Models for Irregularly Sampled Time Series

引用4

关键词:预训练模型,不定期采样时间序列,基础模型

预训练语言模型(PLM),如ChatGPT,极大地推动了自然语言处理领域的发展。这一进展激发了一系列创新研究,探索PLM对时间序列分析的适应性,旨在创建一个统一的基础模型来解决各种时间序列分析任务。然而,这些努力主要集中在定期采样时间序列(RSTS)上,忽视了不定期采样时间系列(ISTS)带来的独特挑战,其特征是采样间隔不均匀和数据普遍缺失。为了弥合这一差距,这项工作迈出了探索PLM用于ISTS分析潜力的第一步。我们首先研究了表示ISTS的各种方法的效果,旨在最大限度地提高PLM在分析中的效率。此外,我们提出了一个统一的基于PLM的框架,名为ISTS-PLM,以解决各种ISTS分析任务。它集成了新颖的时间感知和变量感知PLM,专门用于解决ISTS中棘手的时间序列内和时间序列间建模问题。最后,在综合基准上进行的大量实验表明,ISTS-PLM利用ISTS的结构化和有效的基于序列的表示,在各种分析任务中,如分类、插值、外推、少热和零样本学习场景,跨越医疗保健、生物力学和气候科学等科学领域,始终实现最先进的性能。

 

[2412.12886] TimeCHEAT: A Channel Harmony Strategy for Irregularly Sampled Multivariate Time Series Analysis

引用3

关键词:不规则采样多元时间序列,通道处理,基础模型

不规则采样多元时间序列(ISMTS)在现实中很普遍。由于连续观测值之间的间隔不均匀,序列之间的采样率不同,信道无关(CI)策略在最近的研究中被证明更适合进行完整的多元时间序列预测,但该策略失败了。这种失败可以进一步归因于采样稀疏性,它为有效的CI学习提供了不足的信息,从而降低了其容量。当我们采用信道依赖(CD)策略时,即使更高的容量也无法减轻在不同信道上学习相似嵌入模式时多样性的潜在损失。我们发现,现有的研究认为CI和CD策略是相互排斥的,主要是因为它们将这些策略应用于全球渠道。然而,我们认为渠道策略不一定必须在全球范围内使用。相反,通过在本地和全球范围内适当应用这些策略,我们可以创造一个充分利用这两种策略的机会。这促使我们介绍Channel Harmony ISMTS Transformer(TimeCHEAT),它在本地使用CD,在全球使用CI。具体来说,我们将ISMTS划分为子系列级补丁。在本地,CD策略聚合每个补丁内的信息以进行时间嵌入学习,最大限度地利用相关观测值,同时减少远程无关干扰。在这里,我们通过使用二分图将嵌入学习转化为边权重预测任务来增强通用性,从而消除了对特殊先验知识的需求。在全球范围内,CI策略跨补丁应用,使Transformer能够学习每个渠道的个性化注意力模式。实验结果表明,我们提出的TimeCHEAT在三个主流任务中表现出了具有竞争力的SOTA性能。

 

[2412.01063] MuSiCNet: A Gradual Coarse-to-Fine Framework for Irregularly Sampled Multivariate Time Series Analysis

引用1

关键词:不规则采样多元时间序列,注意力,基础模型

不规则采样多元时间序列(ISMTS)在现实中很普遍。大多数现有方法将ISMTS视为具有缺失值的同步定期采样时间序列,忽略了不规则性主要归因于采样率的变化。本文介绍了一种新的观点,即不规则性在某些意义上本质上是相对的。通过人工从低到高确定采样率,可以将不规则采样的时间序列从粗到细转换为相对规则的时间序列的分层集。我们观察到,额外的粗粒度相对规则序列不仅在一定程度上缓解了不规则采样的挑战,而且还包含了广泛的时间信息,从而成为表示学习的宝贵资产。因此,我们遵循先看到大局,然后深入细节的学习理念,提出了结合多个尺度的多尺度多相关注意力网络(MuSiCNet),以迭代地改进ISMTS表示。具体来说,在每个尺度内,我们探索时间注意力和频率相关矩阵来聚合序列内和序列间的信息,从而通过更丰富、更内在的细节自然地提高表示质量。在相邻尺度上,我们采用了一种包含对比学习和重建结果调整的表示校正方法,以进一步提高表示的一致性。MuSiCNet是一个ISMTS分析框架,在分类、插值和预测三个主流任务上与SOTA竞争。

 

Knowledge-Empowered Dynamic Graph Network for Irregularly Sampled Medical Time Series | OpenReview

引用3

关键词:医疗,不规则采样时间序列,图神经网络

不规则采样医疗时间序列(ISMTS)在医疗保健领域很常见,其中不同的变量在相互关联的同时表现出独特的时间模式。然而,许多现有的方法未能有效地将医学变量之间的差异和相关性结合在一起,导致ISMTS在变量级别对细粒度特征的捕获不足。我们提出了知识赋能动态图网络(KEDGN),这是一种由变量的文本医学知识赋能的图神经网络,旨在模拟ISMTS中变量特定的时间依赖关系和变量间依赖关系。具体来说,我们利用预训练的语言模型从每个变量的医学属性文本描述中提取其语义表示,从医学角度形成变量之间的整体语义视图。基于此,我们分配变量特定的参数空间来捕捉变量特定的时间模式,并生成一个完整的变量图来衡量变量之间的医学相关性。此外,我们采用密度感知机制在不同的时间戳动态调整变量图,以适应ISMTS中变量之间的时变相关性。将变量特定的参数空间和动态图注入到图卷积递归网络中,以同时捕获ISMTS中的变量内和变量间依赖关系。在四个医疗数据集上的实验结果表明,KEDGN的表现明显优于现有方法。

 

[2410.12257] Irregularity-Informed Time Series Analysis: Adaptive Modelling of Spatial and Temporal Dynamics

Code:IcurasLW/MTSFormer-Irregular_Time_Series

引用2

关键词:不规则时间序列,transformer

不规则时间序列数据(IRTS)在现实世界的应用中越来越普遍。我们观察到IRTS可分为两种特殊类型:自然不规则时间序列(NIRTS)和意外不规则时间系列(AIRTS)。现有的各种方法要么忽略不规则模式的影响,要么静态学习NIRTS和AIRTS数据的不规则动态,由于IRTS的稀疏性,数据可用性有限。我们提出了一种新的基于Transformer的通用不规则时间序列数据框架,该框架从四个角度处理IRTS:局部性、时间、空间和不规则性,以最大限度地激发数据的使用潜力。此外,我们设计了一种复杂的不规则门机制,从不规则中自适应地选择与任务相关的信息,提高了对各种IRTS数据的泛化能力。我们进行了广泛的实验,以证明我们的工作对三个高度缺失率数据集(88.4%、94.9%、60%缺失值)的抵抗力,并通过额外的消融研究调查了NIRTS和AIRTS的不规则信息的意义。我们在此https URL中发布我们的实现

 

DNA-T: Deformable Neighborhood Attention Transformer for Irregular Medical Time Series - PubMed

引用5

Code:BaoyaoGroup/DNA-T: DNA-T: Deformable Neighborhood Attention Transformer for Irregular Medical Time Series

关键词:医疗,不规则时间序列,Transformer,注意力,应用

由于患者健康状况的变化,现实世界的电子健康记录(EHR)呈现出不规则性,导致观察之间的时间间隔不同,每个观察点检查的生理变量也不同。最近,基于Transformer的模型在不规则时间序列领域得到了应用。然而,Transformer中的全注意力机制过于关注远距离信息,忽视了条件的短期相关性。因此,该模型无法捕捉患者病情的局部变化或短期波动。因此,我们提出了一种用于不规则医疗时间序列的端到端可变形邻域注意力转换器(DNA-T)。DNA-T通过动态调整注意力接受域并以不规则的时间序列聚集相关的可变形邻域来捕获局部特征。具体来说,我们设计了一个可变形的邻域注意力(DNA)模块,使网络能够通过漂移邻域注意力的接收场来关注相关的邻域。DNA增强了模型对局部信息和局部特征表示的敏感性,从而捕捉到患者病情局部变化的相关性。我们进行了广泛的实验来验证DNA-T的有效性,在预测患者死亡风险方面优于现有的最先进方法。此外,我们设想了一个例子来验证所提出的DNA的有效性。

 

[2409.20092] Continuous-Time Linear Positional Embedding for Irregular Time Series Forecasting

引用2

关键词:不规则采样时间序列预测,位置嵌入

不规则采样时间序列预测在实际应用中普遍存在,其特点是区间不均匀。然而,以前的研究侧重于常规时间序列预测,通常依赖于Transformer架构。为了扩展Transformer来处理不规则时间序列,我们处理了表示数据时间信息的位置嵌入。我们提出了CTLPE,一种学习连续线性函数的方法,用于编码时间信息。通过学习连续时间函数和位置的简明表示,解决了不规则时间序列的两个挑战,即不一致的观测模式和不规则的时间间隔。此外,通过学习基于神经控制微分方程的位置嵌入,从经验上证明了线性连续函数优于其他连续函数,并在理论上得到了理想位置嵌入特性的支持。在各种不规则采样的时间序列数据集上,CTLPE优于现有技术,显示了其增强的功效。

logo
 
posted @ 2025-09-07 16:18  柒城小柒  阅读(134)  评论(0)    收藏  举报