最爱丁珰

2025年3月15日

摘要：先来复习一下各个类型在计算机中的表现形式 \(32\)位浮点数绿色数位越多，所能表示的范围越大（既可以表示更小的数，也可以表示更大的数）；蓝色数位越多，所能表示的精度越高 \(16\)位浮点数好处是可以节省内存。如果我们正在训练神经网络，但是突然发现内存不够了，有哪些解决方法呢？我们就可以把所阅读全文

posted @ 2025-03-15 13:51 最爱丁珰阅读(17) 评论(0) 推荐(0)

8.5 练习

摘要： \((3)\) a.看代码，可以知道就是把\(\text{softmax}\)之后的值当成一个概率分布，然后在里面进行随机抽样；这个样子当然会让困惑度增加，因为选择多了很多 b.这个题干的意思就是让\(\text{softmax}\)之后的概率分布的值进行变化，大的更大，小的更小，从而逼近选择概率最阅读全文

posted @ 2025-03-15 09:29 最爱丁珰阅读(8) 评论(0) 推荐(0)

8.5.6 训练

摘要：下面讲一下分离梯度到底是个什么事，利用下面的图假设不使用detach_()，那么在图中，两个\(h_3\)就是相同的，于是在第二个批次对\(L_2\)进行反向传播的时候，就会退回到第一个批次的计算图中；如果使用detach_()，那么中间的黑色的连线就没有了，于是就会只计算第二个图的梯度了阅读全文

posted @ 2025-03-15 09:10 最爱丁珰阅读(4) 评论(0) 推荐(0)

8.7.1 循环神经网络的梯度分析

摘要：为什么要将式\((8.29)\)的循环计算去除变成式\((8.32)\)？直接对式\((8.29)\)进行递推计算不可以吗？在循环神经网络（RNN）中，将式(8.29)的递归计算展开为式(8.32)的显式求和形式，主要有以下原因： 1. 揭示梯度传播的长期依赖问题式(8.29)的递归形式为： \ 阅读全文

posted @ 2025-03-15 08:52 最爱丁珰阅读(49) 评论(0) 推荐(0)

2025年3月14日

第十二课（2024年）基准测试与评估

摘要：来看一下讲师认为的理想的开发过程 Deploy的Absolute的意思：部署阶段的评测指标是绝对的，之前的阶段都是从若干个模型中选择最好的，但最后一个阶段就只剩下一个模型了，我们必须要让这个模型的准确率达到一个设定的绝对阈值 Publish的Standardized和Reproducible：标准化阅读全文

posted @ 2025-03-14 18:58 最爱丁珰阅读(19) 评论(0) 推荐(0)

123

摘要：产业自金融的本质价值与实践案例分析产业自金融作为金融与产业深度融合的创新模式，通过解决传统金融体系的痛点，推动了产业链的优化升级。本文结合具体案例与文献，从六个核心问题出发，分析其本质价值与实践路径。一、解决信息不对称问题：数据驱动的风控体系传统金融机构因缺乏产业链内部数据，难以评估企业真实信阅读全文

posted @ 2025-03-14 17:57 最爱丁珰阅读(49) 评论(0) 推荐(0)

mysql

摘要：注意下面的操作都要现在任务管理器-服务中打开MySQL80 我们可以像下面这样查看数据库存储的位置文档中说的“MySQL客户端”指的是用户写root，密码写自己安装MySQL的代码，数据库写之前用命令create database dname创建的数据库的名字（即dname）。上面的操作其实就是阅读全文

posted @ 2025-03-14 12:01 最爱丁珰阅读(14) 评论(0) 推荐(0)

2025年3月13日

第十二课问答

摘要：这张图片就是：左边给了一个知识图谱，右边给了一个自然语言转化成逻辑语言然后在知识图谱中进行查询的方法这堂课的重点是谈一谈阅读理解（Reading Comprehension）解释一下两个例子信息提取：假设现在我们想要做一个关于奥巴马的背景信息提取，如图所示，我们现在想要知道奥巴马在哪里受的教育阅读全文

posted @ 2025-03-13 22:31 最爱丁珰阅读(12) 评论(0) 推荐(0)

7.5 练习

摘要： \((6)\) 其实BatchNorm1d，BatchNorm2d和BatchNorm3d的用法都是一样的，参数都只用传一个（即特征维度，手动实现的BatchNorm的num_features）；对于手动实现的BatchNorm的初始化参数num_dims，是由1d，2d和3d来区分的 LazyBa 阅读全文

posted @ 2025-03-13 21:24 最爱丁珰阅读(7) 评论(0) 推荐(0)

6.5.2 填充和步幅

摘要：为什么前面的nn.Conv2d需要指定输出通道数和输入通道数，但是这里的nn.MaxPool2d只用指定核的大小呢？是因为前者在初始化的时候需要明确参数的个数这个样子才能知道要初始化什么东西，而后者是没有参数的，所以只用知道核的大小就好了阅读全文

posted @ 2025-03-13 10:25 最爱丁珰阅读(5) 评论(0) 推荐(0)

公告