会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
yldeveloper
博客园
首页
新随笔
联系
订阅
管理
[置顶]
从矩阵乘法到多模态大模型 - LLM 篇
摘要: 从零开始最少依赖搭建一个基于 GPT-2 Medium 衍生架构的 LLaVA 多模态大模型。这篇文章是LLM部分。
阅读全文
posted @ 2026-06-26 16:49 yLDeveloper
阅读(252)
评论(0)
推荐(2)
2026年5月12日
Triton学习 · Part 1 · Hello, world!
摘要: Triton 算子开发的开端。
阅读全文
posted @ 2026-05-12 21:51 yLDeveloper
阅读(140)
评论(0)
推荐(0)
2026年2月9日
从模型评估、梯度难题到科学初始化:一步步解析深度学习的训练问题
摘要: 要解决模型泛化能力与训练稳定性两大难题,关键在于理解偏差-方差权衡、梯度传播和参数初始化三者间的深层联系。
阅读全文
posted @ 2026-02-09 21:47 yLDeveloper
阅读(318)
评论(0)
推荐(0)
2026年1月23日
[翻译][AlexNet 原文] ImageNet Classification with Deep Convolutional Neural Networks
摘要: 课余时间,手动翻译了 AlexNet 的原文,感觉这篇文章比较适合小白学习,顺便完成了导论作业 但是没有专门去插入引用部分( 经过llm检查,改正了少许翻译错误
阅读全文
posted @ 2026-01-23 21:43 yLDeveloper
阅读(81)
评论(0)
推荐(0)
2025年12月9日
一只菜鸟学深度学习的日记:填充 & 步幅 & 下采样
摘要: 本文浅谈了填充、步幅、下采样,并对其进行拓展。
阅读全文
posted @ 2025-12-09 23:46 yLDeveloper
阅读(1021)
评论(0)
推荐(1)
2025年12月5日
一只菜鸟学深度学习的日记:入门卷积
摘要: 本文浅谈了卷积
阅读全文
posted @ 2025-12-05 23:48 yLDeveloper
阅读(1234)
评论(0)
推荐(3)
2025年12月1日
一只菜鸟学机器学习的日记:入门深度学习计算
摘要: 本文浅谈了层与块、简单参数管理、延迟初始化
阅读全文
posted @ 2025-12-01 22:54 yLDeveloper
阅读(1107)
评论(0)
推荐(3)
2025年11月27日
一只菜鸟学机器学习的日记:入门分布偏移
摘要: 本文浅谈了协变量偏移、标签偏移及其简单解决原理,并以具体例子说明
阅读全文
posted @ 2025-11-27 22:57 yLDeveloper
阅读(1057)
评论(0)
推荐(3)
一只菜鸟学机器学习的日记:梯度问题与Xavier初始化、He Kaiming初始化
摘要: 本文浅谈了几个梯度问题、Xavier初始化、He Kaiming初始化
阅读全文
posted @ 2025-11-27 12:44 yLDeveloper
阅读(134)
评论(0)
推荐(1)
一只菜鸟学机器学习的日记:拟合问题与经典解决方案
摘要: 本文浅谈了偏差与方差关系、L2正则化、Bishop扰动、Dropout
阅读全文
posted @ 2025-11-27 09:37 yLDeveloper
阅读(1904)
评论(0)
推荐(2)
下一页
公告