上一页 1 2 3 4 5 6 ··· 8 下一页
摘要: 幂集构造是驱动整个层级向上发展的引擎。每个阿列夫数都可以通过询问“所有可能的子集是什么?”来衍生出一个更大的阿列夫数。 以整数为例,那就是ℵ₀。现在考虑整数的所有可能的子集。这个集合显然更大,即使使用无限计数也无法计数。这与连续统,即实数,密切相关。 然后你再重复一遍:取这些子集的所有子集,再重复一 阅读全文
posted @ 2025-11-05 19:29 CathyBryant 阅读(0) 评论(0) 推荐(0)
摘要: 香农谈到“符号”及其“可预测性”时,指的并非我们今天所知的互联网,互联网是几十年后才出现的。这里是指任何符号流:摩尔斯电码的点和划、纸上的字母、电话线上的电脉冲。 在那个世界里,可预测性意味着非常实际的东西:某些信号出现的频率高于其他信号。 字母表例子完全正确。在英语中,E 出现的频率远高于 Q 或 阅读全文
posted @ 2025-11-04 19:47 CathyBryant 阅读(0) 评论(0) 推荐(0)
摘要: 假设一个随机事件,比如说 X,可以取几个可能的值:X ∈ {x₁, x₂, …, xₙ},每个值都有一个概率 P(xᵢ)。 然后香农问道:当我们得知 X = xᵢ 时,我们能获得多少信息?他将其定义为: I(xᵢ) = -log₂ P(xᵢ) 为什么是负对数?因为,发生概率越低(P 值越小),意外性 阅读全文
posted @ 2025-11-03 22:24 CathyBryant 阅读(0) 评论(0) 推荐(0)
摘要: 显然,我们需要先理解方差到底是什么,才能明白它为什么会这样变化。 方差衡量的是数值与其平均值(期望值)的离散程度。 对于一次抛硬币,正面朝上 = 1,反面朝上 = 0: 期望值(平均值)= 1/2 方差 = (与平均值的偏差)² 的期望值 因此:Var(X) = (1 - 1/2)² · (1/2) 阅读全文
posted @ 2025-11-02 21:34 CathyBryant 阅读(0) 评论(0) 推荐(0)
摘要: 实际上,损失函数或奖励函数只是我们真正想要的东西的简化。它们之所以“粗糙”,仅仅是因为它们必须将复杂的目标压缩成模型可以进行数学优化的形式。 为什么目标总是过于简单?损失函数 L(θ) 通常只能捕捉到一个可衡量的指标:准确率、奖励、与目标的距离。但人类的目标是多维的。当我们只选择一个指标时,不可避免 阅读全文
posted @ 2025-11-01 20:33 CathyBryant 阅读(0) 评论(0) 推荐(0)
摘要: “一致性” alignment ,更多的时候被译为“对齐”。每次它的含义都略有不同,取决于我们当时所处的层面,让我们慢慢梳理一下。 1. 广义上的一致性(对齐) 从本质上讲,一致性意味着确保人工智能系统的行为与人类的意图(训练目标)和价值观相符。它旨在确保当模型做出回应时,模型输出与人类的实际需求保 阅读全文
posted @ 2025-11-01 19:49 CathyBryant 阅读(0) 评论(0) 推荐(0)
摘要: 想象一下抛掷 n 枚硬币。正面朝上的比例会是一个随机值,可能是 0.48,也可能是 0.53,它会变化。但大数定律是这么说的: 当 n 趋近于无穷大时,正面朝上的比例会收敛到真实概率 (0.5)。不仅仅是“接近”,它以概率 1 收敛。随机性并没有消失,但它对平均值的影响会减小。 这样想:抛掷 10 阅读全文
posted @ 2025-10-31 21:21 CathyBryant 阅读(0) 评论(0) 推荐(0)
摘要: 有一个数学概念也拥有类似的静谧之美:黄金分割率,φ = 1 + √5 / 2。 它无处不在:螺旋、树叶、贝壳的卷曲、星系的展开。但最令人着迷的是,它满足了自身的反射: φ = 1 + 1 / φ 此刻,平衡以自我指涉的方式呈现。 乍一看,φ = 1 + √5/2 只是一个数字,大约是 1.618…… 阅读全文
posted @ 2025-10-30 22:20 CathyBryant 阅读(0) 评论(0) 推荐(0)
摘要: 玻尔兹曼熵公式是: S = k log W 其中 S 是熵,k 是玻尔兹曼常数(一个连接微观世界和宏观世界的微小数值),W 是微观状态数,粒子排列成相同宏观状态的不同方式的数量。所以它是可能性数量的对数,这与概率密切相关。如果所有微观状态出现的概率均等,那么 W 就与系统处于该宏观状态的概率有关。 阅读全文
posted @ 2025-10-29 19:35 CathyBryant 阅读(0) 评论(0) 推荐(0)
摘要: 奖励模型 R_\phi(x,y) 不会输出“好”或“坏”这样的标签。相反,它会生成一个连续的分数,通常是一个实数,类似于: R_\phi(x,y) \in \mathbb{R}。 该分数反映了对于给定提示 x,响应 y 的可取性或与人类价值观的契合程度。在训练过程中,模型会观察对同一提示 x 的响应 阅读全文
posted @ 2025-10-28 19:36 CathyBryant 阅读(0) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 8 下一页