摘要:        
目录离散单元构成连续的整体 (像素/Token -> 图像)从无序的基态到有序的形态 (噪声 -> 图像)用低维信息控制高维表现 (潜在变量 -> 图像特征)生成是对外部条件的响应 (条件生成) 图片生成领域,你能从这张图片中受到什么启发吗? 深圳“世界之窗”拍摄的针雕艺术墙照片,对于学习图像生成的    阅读全文
posted @ 2025-08-01 15:36
jack-chen666
阅读(27)
评论(0)
推荐(0)
        
            
        
        
摘要:        
目录核心矛盾:模型性能 vs. 采样速度从“连续”回到“离散”的动机DFM 是如何工作的?总结:一条螺旋式上升的路线 阅读FUDOKI相关的文章,发现:连续到离散:Discrete Flow Matching (DFM) ??怎么又回到离散了 之前不是NF(Normalization Flow) -    阅读全文
posted @ 2025-08-01 15:26
jack-chen666
阅读(25)
评论(0)
推荐(0)
        
            
        
        
摘要:        
目录路径 (Path):单颗沙粒的“命运轨迹”速度场 (Velocity Field):所有沙粒的“行动指南”散度 (Divergence):沙子密度的“源”与“汇”连续性方程 (Continuity Equation):连接一切的“物理定律”把它们串成一个完整的故事 DDPM、Flow Match    阅读全文
posted @ 2025-08-01 15:13
jack-chen666
阅读(54)
评论(0)
推荐(0)
        
            
        
        
摘要:        
目录参考宏观目标:模拟“流动”过程微观操作:一个Token的“决策之旅”总结 参考 https://arxiv.org/pdf/2505.20147 终于来到了FUDOKI论文的最后一站——推理(Inference)部分。这部分内容将告诉我们,在模型已经训练好之后,我们如何利用它来从无到有地生成全新    阅读全文
posted @ 2025-08-01 11:34
jack-chen666
阅读(30)
评论(0)
推荐(0)
        
            
        
        
摘要:        
目录参考宏观策略:站在巨人肩膀上的两阶段训练微观操作:单步训练的流程与损失函数FUDOKI的核心优势:可修正的“流动” vs 固定的“填充” 参考 https://arxiv.org/pdf/2505.20147 现在来到了FUDOKI论文中关于模型训练(Training)的部分。这部分内容将前面所    阅读全文
posted @ 2025-08-01 10:46
jack-chen666
阅读(28)
评论(0)
推荐(0)
        
            
        
        
摘要:        
目录参考整体框架:一个统一的双向Transformer三大架构创新完全注意力掩码 (Full Attention Mask)输出Logits的移位操作 (Shifting Operation)无需显式的时间嵌入 (No Explicit Time Embedding)多模态处理策略:解耦的编码器 (    阅读全文
posted @ 2025-08-01 10:13
jack-chen666
阅读(38)
评论(0)
推荐(0)
        

 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号