会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
sio2zyh
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
下一页
2025年5月26日
Week2-LLaMA1-RMSNorm,SwiGLU
摘要: 🧠 LayerNorm vs RMSNorm:机制、差异与适用场景详解 归一化(Normalization)是现代神经网络中的基础构件。本文深入分析两种常见的归一化方法:LayerNorm 和 RMSNorm,重点讨论它们的数学机制、对特征分布的影响、适配任务的差异,以及为什么 RMSNorm 在
阅读全文
posted @ 2025-05-26 11:02 SIo_2
阅读(99)
评论(0)
推荐(0)
2025年5月25日
Week2-InstructGPT学习笔记
摘要: InstructGPT: SFT+RM+PPO
阅读全文
posted @ 2025-05-25 21:12 SIo_2
阅读(49)
评论(0)
推荐(0)
Week1-ELMo, BERT, GPT概念
摘要: 📚 NLP 深度学习笔记:ELMo, BERT, GPT 全面解析 https://www.cnblogs.com/zishu/p/17363205.html 🧠 1. ELMo(Embeddings from Language Models) 🧾 核心思想 ELMo 通过 双向 LSTM(B
阅读全文
posted @ 2025-05-25 11:16 SIo_2
阅读(33)
评论(0)
推荐(0)
Week1-GloVe概念
摘要: 🌐 GloVe 词向量算法笔记 一、什么是 GloVe? GloVe(Global Vectors for Word Representation)是斯坦福大学于 2014 年提出的一种用于学习词向量的算法,旨在结合: LSA 的全局共现统计 Word2Vec 的预测式学习方法 它通过构建词对共现
阅读全文
posted @ 2025-05-25 00:11 SIo_2
阅读(38)
评论(0)
推荐(0)
2025年5月24日
Week1-FastText概念
摘要: FastText概念
阅读全文
posted @ 2025-05-24 22:34 SIo_2
阅读(39)
评论(0)
推荐(0)
2025年5月19日
Week1-Word2Vec基础知识
摘要: Word2Vec:CBOW和Skip-gram
阅读全文
posted @ 2025-05-19 22:54 SIo_2
阅读(24)
评论(0)
推荐(0)
2024年3月4日
45右值引用
摘要: 右值引用
阅读全文
posted @ 2024-03-04 21:46 SIo_2
阅读(26)
评论(0)
推荐(0)
44对象优化
摘要: 对象优化
阅读全文
posted @ 2024-03-04 21:45 SIo_2
阅读(24)
评论(0)
推荐(0)
43泛型算法和绑定器
摘要: 泛型算法和绑定器
阅读全文
posted @ 2024-03-04 21:43 SIo_2
阅读(9)
评论(0)
推荐(0)
42函数对象
摘要: 函数对象
阅读全文
posted @ 2024-03-04 21:42 SIo_2
阅读(14)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
下一页
公告