[学习笔记]Flow Matching with MNIST

一刻也没有为扩散模型感到悲哀，接下来赶到战场的是——流匹配！

（牛马圣体是这样的0.0无聊到看代码写博客）

继续贴仓库

不多废话了，继续写吧

0.什么是流匹配

generated_samples_fm

generation_progress_fm

流匹配就是一种很牛逼的方法，用来生成一些东西（）

它是一种生成方法，大概原理就是将噪声图像提升到高维，然后利用一个向量场，让高维特征移动，从而达到生成的目的。

通过之前学的一个最最最简单的demo，大概已经知道了流匹配的运用过程

（虽然没人看但还是贴个链接）

这个还原MNIST的demo让我对流匹配和生成式模型有了更好的了解

1.流匹配的理论基础

说到流匹配的理论基础，那可是相当的简单直白。

就一个最简单的式子：

$$v = \frac{dx}{dt}$$

一个速度场。就是让噪声点往它该去的地方去。

对比一下扩散模型

v = \frac{dx}{dt}

v = \frac{dx}{dt}

流匹配就像是在高维对墨水整体进行受力分析，看穿了墨水滴的变化过程，然后一通操作，吧唧还原了

（潮水啊，我已归来）

这个原理如此之直观与简洁，甚至它的训练步数和采样步数都远远小于扩散模型（DDPM采样1000步，训练500轮；Flow Matching采样100步，训练100轮）

甚至Stable Diffusion3都开始使用流匹配了。

这或许就是数学形式与物理还有代码的完美统一吧。

2.流匹配的实现方法

还是老样子，直接上代码。

哈基米给出的改进代码，其实大致流程与扩散模型差别不大，代码也比DDPM更加好懂。

首先是fm_model.py

v = \frac{dx}{dt}

posted @ 2026-01-07 22:47 阿基米德的澡盆阅读(10) 评论(0) 收藏举报

刷新页面返回顶部

阿基米德的澡盆