摘要:
3.2 dreamtalk 有3个关键组成: 一个去噪网络, 一个风格嘴部专家, 一个风格预测器 去噪网络 输入\(A_w=[a_i]_{i=l-w}^{l+w}\), 这里w是窗口大小. 开始帧是\(m_{0}\).也就是我们的真实图片,加噪 其中t值得是diffusion的stept, t\(\ 阅读全文
posted @ 2024-03-22 14:30
张博的博客
阅读(53)
评论(0)
推荐(0)
contact me:wechat 15122306087