罗西的思考 - 博客园

2025年3月

探秘Transformer之（8）--- 位置编码

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-03-01 14:33 罗西的思考阅读(4454) 评论(5) 推荐(5)

2025年2月

探秘Transformer系列之（7）--- embedding

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-02-27 20:32 罗西的思考阅读(5443) 评论(2) 推荐(5)

探秘Transformer系列之（6）--- token

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-02-24 20:02 罗西的思考阅读(3125) 评论(1) 推荐(1)

探秘Transformer系列之（5）--- 训练&推理

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-02-22 09:55 罗西的思考阅读(4532) 评论(4) 推荐(1)

探秘Transformer系列之（4）--- 编码器 & 解码器

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-02-20 20:42 罗西的思考阅读(6322) 评论(7) 推荐(1)

探秘Transformer系列之（3）---数据处理

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-02-18 21:05 罗西的思考阅读(2477) 评论(4) 推荐(1)

探秘Transformer系列之（2）---总体架构

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-02-15 09:37 罗西的思考阅读(6135) 评论(2) 推荐(13)

探秘Transformer系列之（1）：注意力机制

摘要：探秘Transformer系列之（1）：注意力机制 0x00 概述因为各种事情，好久没有写博客了，之前写得一些草稿也没有时间整理（都没有时间登录博客和微信，导致最近才发现好多未读消息和私信，在这里和各位朋友说下万分抱歉）。现在恢复更新，是因为最近有些从非AI领域转过来的新同学来找我询问是否有比较好阅读全文

posted @ 2025-02-09 11:17 罗西的思考阅读(11168) 评论(13) 推荐(34)

2023年7月

新书出版：《分布式机器学习——系统、工程与实战》

摘要：

## 0x01 广告经过一年多的努力，我的书《分布式机器学习——系统、工程与实战》终于上架了，在这里打个广告。 ![](https://img2023.cnblogs.com/blog/1850883/202307/1850883-20230719224442070-381968133.jpg) 阅读全文

posted @ 2023-07-21 23:50 罗西的思考阅读(2700) 评论(7) 推荐(3)

2022年5月

[源码解析] TensorFlow 分布式之 ClusterCoordinator

摘要：本文我们主要来看看ParameterServerStrategy如何分发计算，也就是ClusterCoordinator如何运作。这是TF分布式的最后一篇。阅读全文

posted @ 2022-05-21 11:45 罗西的思考阅读(685) 评论(0) 推荐(0)

公告