会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Keanshi' Blog
Hi~👋 Welcome to KeanShi's Blog🤔
首页
新随笔
联系
订阅
管理
2025年4月1日
【杂学】Efficient Training for DiT
摘要: Diffusion Transformer 高效训练
阅读全文
posted @ 2025-04-01 16:54 KeanShi
阅读(169)
评论(0)
推荐(0)
2025年2月5日
【杂学】知识蒸馏原理解读
摘要: 知识蒸馏技术(Knowledge Distillation,KD)原理解读
阅读全文
posted @ 2025-02-05 15:24 KeanShi
阅读(441)
评论(0)
推荐(0)
2024年12月20日
【代码】LLaVA 代码学习与调试
摘要: 从代码角度详解LLaVA
阅读全文
posted @ 2024-12-20 14:48 KeanShi
阅读(1770)
评论(0)
推荐(0)
2024年12月12日
【代码】LLaVA 代码运行记录
摘要: LLaVA & LLaVolta 代码排坑指南
阅读全文
posted @ 2024-12-12 15:52 KeanShi
阅读(573)
评论(0)
推荐(0)
2024年11月20日
【论文阅读笔记】多模态大语言模型必读 —— LLaVA
摘要: LLaVA (Large Language and Vision Assistant),proposed by Haotian Liu (UWM), et al.
阅读全文
posted @ 2024-11-20 16:22 KeanShi
阅读(978)
评论(0)
推荐(0)
2024年11月13日
【杂学】大模型推理加速 —— KV-cache 技术
摘要: 大模型推理加速技术 —— KV-cache 详细图解与公式推导
阅读全文
posted @ 2024-11-13 20:47 KeanShi
阅读(699)
评论(0)
推荐(0)
2024年11月11日
【杂学】先进的 NLP 技术 —— 旋转位置编码(Rotary Position Embedding,RoPE)
摘要: LLM 中的 位置编码(Positional Encoding, PE)
阅读全文
posted @ 2024-11-11 23:22 KeanShi
阅读(769)
评论(0)
推荐(0)
2024年11月8日
【论文阅读笔记】Transformer ——《Attention Is All You Need》
摘要: Transformer by Google brain
阅读全文
posted @ 2024-11-08 19:58 KeanShi
阅读(188)
评论(0)
推荐(0)
2024年10月27日
【论文阅读笔记】QwenLM 多模态版本 —— Qwen-VL/Qwen2-VL
摘要: Qwen Team, Alibaba Group
阅读全文
posted @ 2024-10-27 21:44 KeanShi
阅读(4912)
评论(0)
推荐(0)
2024年10月21日
【论文阅读笔记】大模型推理加速 —— FastV
摘要: FastV, a plug-and-play method proposed by Liang Chen (ICL, Peking University), et al.
阅读全文
posted @ 2024-10-21 15:47 KeanShi
阅读(428)
评论(0)
推荐(0)
下一页
公告