摘要: 超越O(n²)复杂度:挑战Transformer架构的前沿模型 一、 卫冕冠军的“阿喀琉斯之踵” 在介绍挑战者之前,我们必须首先理解Transformer架构为何会暴露出弱点。其强大的全局信息交互能力源于自注意力机制,但这同样也是其致命弱点:二次方复杂度 (Quadratic Complexity) 阅读全文
posted @ 2025-09-22 10:38 Engineblogs 阅读(163) 评论(0) 推荐(0)
摘要: 本文档深入探讨了如何利用光学原理进行高效计算,特别是针对现代AI模型中常见的卷积和矩阵乘法操作。内容涵盖了从加速卷积的深层数学基础,到实现这些计算的各种前沿光学器件,最后对光学加速器与传统GPU进行了系统级的比较与展望。 一、 卷积计算的数学加速原理:FFT的魔法 长卷积运算是许多现代AI模型(如H 阅读全文
posted @ 2025-09-22 10:22 Engineblogs 阅读(86) 评论(0) 推荐(0)
摘要: 十分精彩,一些观点可谓石破惊天。1905年前后物理学群星璀璨,这一个世纪似乎基础理论停滞了。但Wolfram即将带来一次新的科学大突破(AI、生物、物理等),拭目以待,智人能上一个新台阶。 1. 意识」是「以某种方式对计算进行整合和线性化呈现」 与其说意识是要「超越」广义的智能或一般的计算复杂性,毋 阅读全文
posted @ 2025-05-09 09:30 Engineblogs 阅读(81) 评论(0) 推荐(0)
摘要: 高斯过程的核函数设计在高维空间(如图像像素、文本词向量)中难以有效捕捉复杂特征,主要原因包括以下几点: 1. 核函数的局部性限制 大多数传统核函数(如RBF核、Matern核)基于局部相似性假设,即两个数据点的相似性随其欧氏距离的增大而指数衰减。这种假设在高维空间中面临以下问题: 维数灾难:高维空间 阅读全文
posted @ 2025-02-26 14:14 Engineblogs 阅读(87) 评论(0) 推荐(0)
摘要: 问题1. 问及transformer极限scale,以及高维空间优化的本质、计算不可约等问题,deepseek的回答 回答:您提出的问题触及了复杂系统理论的核心奥秘。让我们从数学本质层面剖析这个命题: 自指方程W=σ(WX)的涌现机制: 当参数量达到1e23量级时,网络权重矩阵W的维度将满足dim( 阅读全文
posted @ 2025-02-14 16:31 Engineblogs 阅读(109) 评论(0) 推荐(0)
摘要: 问题1:大模型是否具备产生新知识的能力,比如新的物理定律。思考:这个问题需要仔细分析。需要明确“新知识”的定义。如果是指人类尚未发现的知识,比如全新的物理定律,那么模型是否可能做到?根据现有的大模型原理,模型是通过训练数据中的模式学习,生成的内容本质上是训练数据的组合和推断,而不是真正的创新。例如, 阅读全文
posted @ 2025-02-08 11:19 Engineblogs 阅读(281) 评论(0) 推荐(0)
摘要: 好的,我需要回答用户关于Groq架构的两个问题。首先,用户问Groq是否类似于ASIC的超级版本。其次,用户想知道为什么其他公司不采用张量流编程范式。我需要确保回答准确且易于理解。 第一个问题,用户提到Groq是软件定义硬件的极端设计,类似ASIC的超级版本。我需要解释Groq与ASIC的异同。AS 阅读全文
posted @ 2025-02-08 10:31 Engineblogs 阅读(60) 评论(0) 推荐(0)
摘要: Deepseek-R1的精彩表达能力 问:请作为乔布斯,提出设想:Apple Mind Bridge,核心理念:"让思维直接对话,让创意即刻呈现",借助类似cursor,devin这样的AI编程,使想法实时变成代码,给出结果 deepseek答:(乔布斯风格的舞台步伐,背景渐现极简神经元动态投影) 阅读全文
posted @ 2025-02-06 14:21 Engineblogs 阅读(42) 评论(0) 推荐(0)
摘要: 连接的重要意义--(三)脑连接、同构,自指,复杂的涌现 1. 脑连接,意识的产生,IIT信息整合理论 如果动物的各种行为都是有意识的,那凭什么植物对光的反应,或者电子的自旋现象,就没有意识呢? 许多人认为,构成人类囊胚的微观细胞集合是没有感觉经验的。但随着时间的推移,这些细胞会不断增殖,慢慢变成一个 阅读全文
posted @ 2021-06-21 09:19 Engineblogs 阅读(628) 评论(0) 推荐(0)
摘要: 连接的重要意义--(二)创新的本质 1. 创新的本质是连接--技术发明,科学理论,数学皆是连接 布莱恩阿瑟在《技术的本质》一书中提到,技术发明是一个联通的时刻,是在问题与能够解决的问题的原理之间完全的连接。对于发现者来讲,这个洞见是如此完整,让人觉得无意识之间各个部分已经被组合完好,而且它一来大家就 阅读全文
posted @ 2021-06-21 08:41 Engineblogs 阅读(927) 评论(0) 推荐(0)