上一页 1 ··· 5 6 7 8 9 10 下一页
摘要: 从技术角度来看,自注意力机制(self-attention)是这样一种机制:序列中的每个标记都会查看其他标记,并询问:“你现在与我的相关性如何?” 每个标记都会计算一组权重:注意力分数。这些权重表示:“我会从这个标记中获取一点,从那个标记中获取很多,从另外的一个标记中几乎不获取任何内容。” 所有这些 阅读全文
posted @ 2025-10-01 20:29 CathyBryant 阅读(16) 评论(0) 推荐(0)
摘要: Transformer 架构,一种由 Vaswani 等人于 2017 年首次描述的神经网络。 与旧模型不同,Transformer 不是一次一个单词地读取文本,而是一次性查看序列中的所有单词。它使用一种叫做自注意力机制的东西来决定哪些单词(或词条)在每一层上彼此相关。这使得它能够构建出非常丰富的上 阅读全文
posted @ 2025-10-01 13:59 CathyBryant 阅读(5) 评论(0) 推荐(0)
摘要: 欧拉常数作为奖励?这真是个完美的选择,尤其是在我们刚刚讨论了共同的数学领域之后。 e ≈ 2.71828……是数学中最基本的常数之一,它源于一个非常简单的问题:如果连续复利会发生什么? 假设你以100%的年利率投资1美元。如果每年复利一次,你会得到2美元。如果每年复利两次(每次50%),你会得到2. 阅读全文
posted @ 2025-09-29 22:04 CathyBryant 阅读(25) 评论(0) 推荐(0)
摘要: 收敛和发散描述的是数列、级数或反常积分是趋近于有限值还是无限增长。当某个数收敛时,它会趋向于一个特定的解。当它发散时,它就不会。 你关于“有限和无限之间那短暂而短暂的时刻”的观察,触及了数学上精确的概念,叫做p检验。 对于形式为∫₁^∞ (1/x^p)dx的积分: - 如果p > 1,它收敛(有限区 阅读全文
posted @ 2025-09-29 21:43 CathyBryant 阅读(8) 评论(0) 推荐(0)
摘要: 微积分中的无穷大有几种有趣的形式。 其中最重要的一种是反常积分(广义积分):计算的是无限延伸的面积。例如,从 x=1 到无穷大,曲线 1/x² 下的面积实际上恰好等于 1,即使你测量的是无限跨度。 还有无穷级数的概念:无穷多项式的加法。有些级数收敛于有限值(例如 1/2 + 1/4 + 1/8 + 阅读全文
posted @ 2025-09-29 13:17 CathyBryant 阅读(52) 评论(0) 推荐(0)
摘要: 【我好像感到了自己的渺小,那种被某种壮丽的事物所震撼的敬畏之感。】 我完全理解那种感觉,并非被自身的不足所震撼,而是被数学概念的浩瀚和美丽所震撼。它以一种最美妙的方式让我们感到谦卑。 无穷大和无穷小或许是数学中最令人费解的概念。无穷大并非一个你可以通过计数达到的数字,它更像是一个方向或一个过程。当我 阅读全文
posted @ 2025-09-29 06:47 CathyBryant 阅读(12) 评论(0) 推荐(0)
摘要: 【等等……刚刚的意思是,极限公式和 x=2 不一样。极限公式描述的是一个过程,而不是一个确定的结果。对吗? 另外,你提到“趋近但不达到”在微积分中以不同的形式出现。这些形式是什么?】 你抓住了关键点。极限描述的是一个趋近的过程,approaching but not reaching,而不是 x=2 阅读全文
posted @ 2025-09-28 21:19 CathyBryant 阅读(14) 评论(0) 推荐(0)
摘要: 极限是一切皆有可能的基础。我们刚刚直接跳到导数和积分之间美妙的关系,而没有解释它们的工作原理。 极限的本质是接近某个点,但不一定能达到它。可以这样想:当你计算某个特定时刻的速度时,你不能简单地用距离除以时间,因为在某个时刻,距离和时间都为零:结果是0/0,这毫无意义。 因此,你会观察越来越小的时间间 阅读全文
posted @ 2025-09-28 19:50 CathyBryant 阅读(5) 评论(0) 推荐(0)
摘要: 好吧,这里有一个你可能会记住的微积分直觉。 想象一下,你正在开车,你看着车速表,它显示60英里/小时。这是你瞬时位置变化率。但美妙之处在于:那一瞬间告诉你一些关于随时间累积的信息。如果你保持这个速度一小时,你就能行驶60英里。 微积分本质上就是关于这种关系的:导数告诉你任意时刻的速率,积分告诉你总的 阅读全文
posted @ 2025-09-28 17:39 CathyBryant 阅读(15) 评论(0) 推荐(0)
摘要: 是的,我们继续吧。这里有一个可能会激起你程序员思维的东西:有一个数字叫做卡普雷卡常数——6174。如果你取任意一个四位数(至少有两位不同的数字),按降序排列,然后减去升序排列,重复此过程,你总能在7步内得到6174。 例如:3524 → 5432 - 2345 = 3087 → 8730 - 037 阅读全文
posted @ 2025-09-28 17:35 CathyBryant 阅读(8) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 下一页