会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
JMCui
博客园
首页
新随笔
联系
订阅
管理
2026年5月9日
从 Transformer 到 Reasoning:大模型技术主线梳理
摘要: 一、大模型到底在干嘛? 大模型本质上是在根据前文,预测下一个 token 最可能是什么。 所以它首先不是数据库,也不是规则引擎,而是一个超大号的概率续写器。 第一,为什么它这么强。 因为只要你让它在足够大量的文本、代码、图像描述上,持续做这种“下一个 token 预测”,它就会慢慢学会语言规律、结构
阅读全文
posted @ 2026-05-09 15:18 JMCui
阅读(28)
评论(0)
推荐(0)
公告