Scaling Rectified Flow Transformers for High-Resolution Image Synthesis -------stabledifusion3 的论文.

流的定义:
\(x_1\)是一个采样的图像从分布\(p_1\)采样来,\(p_1\)是一个噪音的分布.
\(x_0\)是一个真实的图片他从图片分布\(p_0\)采样来的.

\(x_1\)\(x_0\)的映射函数我们用下面的微分方程来刻画.
\(dy_t=v_{\theta}(y_t,t)d_t\)
v是神经网络输出的一个函数.

定义\(z_t=a_tx_0+b_t\epsilon ~~ where ~~ \epsilon \in N(0,1)\)
\(a_t,b_t是两个t的函数\),定义一个路径\(p_t\) 表示从\(p_0\)\(p_1=N(0,1)\).

\(p_t表示t时间时候的概率函数\)

\[p_t(z_t)=E_{\epsilon\sim N(0,1)} p_t(z_t|\epsilon)=\int_{\epsilon} p_t(z_t|\epsilon)f(\epsilon) \tag 1 \]

ps:

\(~~~\)条件概率的计算公式. \(p_t(z_t,\epsilon)=p_t(z_t|\epsilon)f(\epsilon), 公式两遍对\epsilon 求积分就是公式(1)了\)

posted on 2025-11-27 11:32  张博的博客  阅读(1)  评论(0)    收藏  举报

导航