02 2025 档案

摘要:高斯过程的核函数设计在高维空间(如图像像素、文本词向量)中难以有效捕捉复杂特征,主要原因包括以下几点: 1. 核函数的局部性限制 大多数传统核函数(如RBF核、Matern核)基于局部相似性假设,即两个数据点的相似性随其欧氏距离的增大而指数衰减。这种假设在高维空间中面临以下问题: 维数灾难:高维空间 阅读全文
posted @ 2025-02-26 14:14 Engineblogs 阅读(29) 评论(0) 推荐(0)
摘要:问题1. 问及transformer极限scale,以及高维空间优化的本质、计算不可约等问题,deepseek的回答 回答:您提出的问题触及了复杂系统理论的核心奥秘。让我们从数学本质层面剖析这个命题: 自指方程W=σ(WX)的涌现机制: 当参数量达到1e23量级时,网络权重矩阵W的维度将满足dim( 阅读全文
posted @ 2025-02-14 16:31 Engineblogs 阅读(58) 评论(0) 推荐(0)
摘要:问题1:大模型是否具备产生新知识的能力,比如新的物理定律。思考:这个问题需要仔细分析。需要明确“新知识”的定义。如果是指人类尚未发现的知识,比如全新的物理定律,那么模型是否可能做到?根据现有的大模型原理,模型是通过训练数据中的模式学习,生成的内容本质上是训练数据的组合和推断,而不是真正的创新。例如, 阅读全文
posted @ 2025-02-08 11:19 Engineblogs 阅读(81) 评论(0) 推荐(0)
摘要:好的,我需要回答用户关于Groq架构的两个问题。首先,用户问Groq是否类似于ASIC的超级版本。其次,用户想知道为什么其他公司不采用张量流编程范式。我需要确保回答准确且易于理解。 第一个问题,用户提到Groq是软件定义硬件的极端设计,类似ASIC的超级版本。我需要解释Groq与ASIC的异同。AS 阅读全文
posted @ 2025-02-08 10:31 Engineblogs 阅读(42) 评论(0) 推荐(0)
摘要:Deepseek-R1的精彩表达能力 问:请作为乔布斯,提出设想:Apple Mind Bridge,核心理念:"让思维直接对话,让创意即刻呈现",借助类似cursor,devin这样的AI编程,使想法实时变成代码,给出结果 deepseek答:(乔布斯风格的舞台步伐,背景渐现极简神经元动态投影) 阅读全文
posted @ 2025-02-06 14:21 Engineblogs 阅读(22) 评论(0) 推荐(0)

点击右上角即可分享
微信分享提示