摘要: 解密Prompt系列68. 告别逐词蹦字 - 重塑 Transformer 的推理范式 慢思考的本质依然是通过生成更多的显性 Token 来换取计算时间。为了想得深,必须说得多。这一章的四篇论文都在尝试:能否在不输出废话的情况下,让模型在内部“空转”思考? 甚至打破自回归全局规划? 阅读全文
posted @ 2026-01-15 08:52 风雨中的小七 阅读(170) 评论(0) 推荐(0)