摘要: 为什么卷积核爱用 3×3?CNN 设计 “约定俗成” 的底层逻辑做深度学习的同学,对 CNN 里 3×3 卷积核、最大池化、BN 层这些设计肯定不陌生,但你有没有想过:为啥卷积核总选 3×3?池化层为啥默认最大池化?BN 层又是咋让训练飞起的?今天咱们抛开公式,用 “人话 + 小实验” 扒一扒这些设 阅读全文
posted @ 2025-08-28 20:26 yfceshi 阅读(58) 评论(0) 推荐(0)
摘要: 视频生成中的多主体开放集个性化paper title:Multi-subject Open-set Personalization in Video GenerationSnap发表在CVPR 2025的工作就是paperCode:链接图1. 在给定文本提示以及每个主体的参考图像(例如,人、狗)和背 阅读全文
posted @ 2025-08-28 19:46 yfceshi 阅读(30) 评论(0) 推荐(0)