Scaling Rectified Flow Transformers for High-Resolution Image Synthesis -------stabledifusion3 的论文.
流的定义:
\(x_1\)是一个采样的图像从分布\(p_1\)采样来,\(p_1\)是一个噪音的分布.
\(x_0\)是一个真实的图片他从图片分布\(p_0\)采样来的.
从\(x_1\)到\(x_0\)的映射函数我们用下面的微分方程来刻画.
\(dy_t=v_{\theta}(y_t,t)d_t\)
v是神经网络输出的一个函数.
定义\(z_t=a_tx_0+b_t\epsilon ~~ where ~~ \epsilon \in N(0,1)\)
\(a_t,b_t是两个t的函数\),定义一个路径\(p_t\) 表示从\(p_0\)到\(p_1=N(0,1)\).
\(p_t表示t时间时候的概率函数\)
\[p_t(z_t)=E_{\epsilon\sim N(0,1)} p_t(z_t|\epsilon)=\int_{\epsilon} p_t(z_t|\epsilon)f(\epsilon) \tag 1
\]
ps:
\(~~~\)条件概率的计算公式. \(p_t(z_t,\epsilon)=p_t(z_t|\epsilon)f(\epsilon), 公式两遍对\epsilon 求积分就是公式(1)了\)
浙公网安备 33010602011771号