摘要: 🧠 LayerNorm vs RMSNorm:机制、差异与适用场景详解 归一化(Normalization)是现代神经网络中的基础构件。本文深入分析两种常见的归一化方法:LayerNorm 和 RMSNorm,重点讨论它们的数学机制、对特征分布的影响、适配任务的差异,以及为什么 RMSNorm 在 阅读全文
posted @ 2025-05-26 11:02 SIo_2 阅读(99) 评论(0) 推荐(0)
摘要: InstructGPT: SFT+RM+PPO 阅读全文
posted @ 2025-05-25 21:12 SIo_2 阅读(49) 评论(0) 推荐(0)
摘要: 📚 NLP 深度学习笔记:ELMo, BERT, GPT 全面解析 https://www.cnblogs.com/zishu/p/17363205.html 🧠 1. ELMo(Embeddings from Language Models) 🧾 核心思想 ELMo 通过 双向 LSTM(B 阅读全文
posted @ 2025-05-25 11:16 SIo_2 阅读(33) 评论(0) 推荐(0)
摘要: 🌐 GloVe 词向量算法笔记 一、什么是 GloVe? GloVe(Global Vectors for Word Representation)是斯坦福大学于 2014 年提出的一种用于学习词向量的算法,旨在结合: LSA 的全局共现统计 Word2Vec 的预测式学习方法 它通过构建词对共现 阅读全文
posted @ 2025-05-25 00:11 SIo_2 阅读(38) 评论(0) 推荐(0)
摘要: FastText概念 阅读全文
posted @ 2025-05-24 22:34 SIo_2 阅读(39) 评论(0) 推荐(0)
摘要: Word2Vec:CBOW和Skip-gram 阅读全文
posted @ 2025-05-19 22:54 SIo_2 阅读(24) 评论(0) 推荐(0)
摘要: 右值引用 阅读全文
posted @ 2024-03-04 21:46 SIo_2 阅读(26) 评论(0) 推荐(0)
摘要: 对象优化 阅读全文
posted @ 2024-03-04 21:45 SIo_2 阅读(24) 评论(0) 推荐(0)
摘要: 泛型算法和绑定器 阅读全文
posted @ 2024-03-04 21:43 SIo_2 阅读(9) 评论(0) 推荐(0)
摘要: 函数对象 阅读全文
posted @ 2024-03-04 21:42 SIo_2 阅读(14) 评论(0) 推荐(0)