摘要: Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model(2024,8) Paper TODO: 目前没有开源代码,实时关注一下official code,Meta的工作基本开源的.本文给出了一 阅读全文
posted @ 2024-09-04 23:02 chenfengshijie 阅读(337) 评论(0) 推荐(1)
摘要: Towards Robust Blind Face Restoration with Codebook Lookup Transformer(NeurIPS 2022) 这篇论文试图解决的是盲目面部恢复(blind face restoration)问题,这是一个高度不确定的任务,通常需要辅助指导来 阅读全文
posted @ 2024-09-04 22:58 chenfengshijie 阅读(303) 评论(0) 推荐(0)
摘要: RestoreFormer++: Towards Real-World Blind Face Restoration from Undegraded Key-Value Pairs(IEEE,2023,8) Paper GitHub 动机:认为之前的模型都只关注了图像的纹理信息,而忽视了人脸的细节信 阅读全文
posted @ 2024-09-04 22:55 chenfengshijie 阅读(89) 评论(0) 推荐(0)
摘要: ControlNeXt: Powerful and Efficient Control for Image and Video Generation(2024,8) paper Github 进一步在ControlNet上进行了改进,主要针对一下两点 对于每一个模块添加一个Zero-Conv也会占用 阅读全文
posted @ 2024-08-19 21:22 chenfengshijie 阅读(124) 评论(0) 推荐(0)
摘要: Paper Reading:ChatGLM: A Family of Large Language Models from GLM-130B to GLM-4 All Tools。 阅读全文
posted @ 2024-07-17 15:40 chenfengshijie 阅读(276) 评论(0) 推荐(0)
摘要: 一些读过的视频生成相关的论文 阅读全文
posted @ 2024-06-13 22:08 chenfengshijie 阅读(248) 评论(0) 推荐(0)
摘要: 记录一下阅读的生成方向的论文 阅读全文
posted @ 2024-01-23 22:10 chenfengshijie 阅读(83) 评论(0) 推荐(0)
摘要: FlashAttention简要介绍 阅读全文
posted @ 2023-12-16 15:47 chenfengshijie 阅读(223) 评论(0) 推荐(0)
摘要: 扩散模型推理过程,主要是原理的分析。 阅读全文
posted @ 2023-12-14 17:44 chenfengshijie 阅读(128) 评论(0) 推荐(0)
摘要: 对于之前GAN论文的汇总 阅读全文
posted @ 2023-09-08 14:12 chenfengshijie 阅读(163) 评论(0) 推荐(0)