摘要:        
从零开始解析Transformer,目标是:(1) 解析Transformer如何运作,以及为何如此运作,让新同学可以入门;(2) 力争融入一些比较新的或者有特色的论文或者理念,让老鸟也可以有所收获。    阅读全文
        
            posted @ 2025-02-15 09:37
罗西的思考
阅读(4345)
评论(1)
推荐(12)
        
        
            
        
        
摘要:        
探秘Transformer系列之(1):注意力机制 0x00 概述 因为各种事情,好久没有写博客了,之前写得一些草稿也没有时间整理(都没有时间登录博客和微信,导致最近才发现好多未读消息和私信,在这里和各位朋友说下万分抱歉)。现在恢复更新,是因为最近有些从非AI领域转过来的新同学来找我询问是否有比较好    阅读全文
        
            posted @ 2025-02-09 11:17
罗西的思考
阅读(8283)
评论(13)
推荐(29)
        
        
 
                     
                    
                 
                    
                 ## 0x01 广告 经过一年多的努力,我的书 《分布式机器学习——系统、工程与实战》终于上架了,在这里打个广告。 
## 0x01 广告 经过一年多的努力,我的书 《分布式机器学习——系统、工程与实战》终于上架了,在这里打个广告。      
         浙公网安备 33010602011771号
浙公网安备 33010602011771号