摘要:
为什么需要校准?在很多场景中,我们不仅关心模型输出的预测类别,还关心模型输出的预测概率,然而模型输出的预测概率未必等于真实的概率。概率校准就是重新计算预测概率,以让它尽量接近真实的概率。 阅读全文
为什么需要校准?在很多场景中,我们不仅关心模型输出的预测类别,还关心模型输出的预测概率,然而模型输出的预测概率未必等于真实的概率。概率校准就是重新计算预测概率,以让它尽量接近真实的概率。 阅读全文
posted @ 2025-07-13 14:05
zhb2000
阅读(413)
评论(0)
推荐(0)

本文介绍了变分信息瓶颈 (VIB) 的公式推导及其在神经网络中的应用。VIB 通过最大化特征与标签的互信息、最小化特征与输入的互信息,实现特征压缩与判别能力的平衡。文中详细推导了互信息的变分近似及其优化方式,并分析了 VIB 与 VAE 的联系及正则化效果。
关于 VAE 的解读和教程已经很多了,但是它们大多是从“逆向工程”的角度出发,作者已经事先知道了 ELBO 这个东西,然后在推导时想办法让公式往 ELBO 上靠。能不能从“正向工程”的角度出发进行推导呢?假设我不了解变分推断和 VAE,怎样从熟悉的极大似然估计出发,一步一步排除掉不合理的设计方案,最终重新发明一遍 VAE 呢?本文将带你踏上这一旅程。
Git for Windows 的 Bash 有一个很实用的功能,如果当前目录处于 Git 仓库中,那么命令行中会显示当前 Git 分支的名称(见下图)。 然而原版的 MSYS2 Bash 没有这个功能(见下图),不过我们可以自己动手配置出相同的效果。 配置方法 打开 MSYS2 的家目录,找到 .
题目 题目链接:593. 有效的正方形 题意:给出二维平面上四个点的坐标,判断这四个点是否能构成一个正方形,四个点的输入顺序不做任何保证。 思路 通过向量运算可以很轻松地解决这道题。任取一点向其他三点连线,可以得到三个向量。我们将这三个向量按照其长度从小到大排序,分别称为 \(\boldsymbol
求解方法 两个技巧: 用向量来表示点,则可以用向量加法来表示点的平移。 用点和向量来表示直线,这样可以处理斜率无穷大的情况。 如图所示,有两条直线交于点 \(I\)。我们用点 \(p_1\) 和向量 \(\vec v_1\) 来表示直线 1,用点 \(p_2\) 和向量 \(\vec v_2\) 来
浙公网安备 33010602011771号