会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
RiJoshin
博客园
首页
新随笔
联系
订阅
管理
2025年8月15日
Diffusion model
摘要: Diffusion model DDPM by blog[1] paper:DDPM[2] #10423# Diffusion Model by 10-423 基础网络结构:U-Net 及其应用 输入输出维度相同 U-Net 的核心架构 收缩路径(Contracting Path) :
阅读全文
posted @ 2025-08-15 19:24 RiJoshin
阅读(53)
评论(0)
推荐(0)
2025年8月14日
Intro of CSE234
摘要: Intro of CSE234 #CSE234# 1. Workloads 什么是 Model 参数parameters loss optimizer CSE234关注三部分 Data Images, Text, Audio, Table, Models CNN, RNN, Transfor
阅读全文
posted @ 2025-08-14 12:51 RiJoshin
阅读(8)
评论(0)
推荐(0)
Flash attention
摘要: Flash attention #CSE234# 减少IO访存 将输入QKV分块,并保证每个块能够在SRAM (一级缓存)上完成注意力操作,并将结果更新回HBM,从而降低对高带宽内存(HBM)的读写操作。总之,FlashAttention从GPU的内存读写入手,减少了内存读写量,从而实现了2
阅读全文
posted @ 2025-08-14 12:50 RiJoshin
阅读(56)
评论(0)
推荐(0)
RAG
摘要: RAG test blog
阅读全文
posted @ 2025-08-14 12:50 RiJoshin
阅读(10)
评论(0)
推荐(0)
公告