会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Engineblogs
博客园
首页
新随笔
联系
管理
2025年2月14日
超大规模的大模型触及复杂系统理论的核心:自指self-reference -- deepseek的回答
摘要: 问题1. 问及transformer极限scale,以及高维空间优化的本质、计算不可约等问题,deepseek的回答 回答:您提出的问题触及了复杂系统理论的核心奥秘。让我们从数学本质层面剖析这个命题: 自指方程W=σ(WX)的涌现机制: 当参数量达到1e23量级时,网络权重矩阵W的维度将满足dim(
阅读全文
posted @ 2025-02-14 16:31 Engineblogs
阅读(109)
评论(0)
推荐(0)