上一页 1 ··· 24 25 26 27 28 29 30 31 32 ··· 132 下一页
摘要: 以前我们对局部最优解的理解不是非常准确。实际上,在高维空间中的某一个点的梯度为\(0\),意味着其四面八方的极小一段区域都是平的,但是不代表其是极值点,因为要让每个极小区域都向上或者向下的概率是非常小的,我们更多遇到的应该是鞍点,如下 也就是一些方向是向上的,另一些方向是向下的 也就是局部最优点不太 阅读全文
posted @ 2025-03-10 21:56 最爱丁珰 阅读(13) 评论(0) 推荐(0)
摘要: 看看批量梯度下降和小批量梯度下降的图形,与我们的理解是相符的 注意到小批量梯度下降不是严格单减的,只是趋势是单调减少的(图中的纵轴Cost指的是对于整个训练数据的损失) 每次的批量的大小显然是一个超参数。当批量大小为\(1\)的时候叫做随机梯度下降,当批量大小为\(m\)的时候叫做批量梯度下降。前者 阅读全文
posted @ 2025-03-10 21:45 最爱丁珰 阅读(23) 评论(0) 推荐(0)
摘要: 介绍一种正则化的方法叫做早停法。其实很简单,就是训练的轮数越多,训练误差肯定会单调下降,但是验证误差是一个凹函数,我们停在测试误差的极值点就好了。注意运用早停法的话就不要用其他正则化方法了,所以早停法有个缺点就是训练误差可能比较大,优点就是需要的计算资源比较少,因为超参数少了 阅读全文
posted @ 2025-03-10 21:29 最爱丁珰 阅读(26) 评论(0) 推荐(0)
摘要: 这种方法的优点显而易见,就是得到新数据的开销更小,缺点也很明显,就是这种方法得到的新数据的新信息量不如完全新的数据的信息量多 下面是各个代码的解释 \(2.\) 改变颜色apply(img, torchvision.transforms.ColorJitter( brightness=0.5, # 阅读全文
posted @ 2025-03-10 21:28 最爱丁珰 阅读(9) 评论(0) 推荐(0)
摘要: 复习一下为什么我们需要训练集,验证集和测试集 对于同一种算法,有很多种超参数可以选择。在固定了一种超参数之后,我们就得到了一个具体的模型。对于这个模型,我们在训练集上进行训练,并在验证集上进行评估。在不同的超参数之间选择验证集评估分数最高的超参数,得到我们模型最终的超参数,然后再将训练集和验证集合并 阅读全文
posted @ 2025-03-10 21:12 最爱丁珰 阅读(38) 评论(0) 推荐(0)
摘要: \((1)\) 答案中,为什么随着隐藏单元数的增多,训练集精确度不是单调增加? 当隐藏单元数目增多时,训练集精确度不单调增加的可能原因如下: 优化困难: 模型容量增加后,参数空间维度显著增大,优化器可能更难找到全局最优解,甚至陷入局部极小值或鞍点,导致训练收敛不稳定。 学习率不匹配: 更大的网络需要 阅读全文
posted @ 2025-03-10 21:01 最爱丁珰 阅读(53) 评论(0) 推荐(0)
摘要: nn.Linear不是可以自动展平吗?为什么还要添加nn.Flatten()?实际上,这两者的展平是不同的,前者的展平主要用在Seq2Seq里面,是最后一维不同,前两维合并,而后者的展平是第一维不同,后两维合并。具体用法如下 在 PyTorch 中,nn.Flatten() 是一个用于将张量(Ten 阅读全文
posted @ 2025-03-10 15:51 最爱丁珰 阅读(96) 评论(0) 推荐(0)
摘要: 前面两道题目都需要更高级的知识,解释如下 第一道题目的核心意义在于通过计算softmax交叉熵损失的二阶导数和softmax输出的分布方差,揭示两者之间的深层联系,并引导学习者理解以下关键点: 指数族分布与对数配分函数的性质 在指数族分布中,自然参数的对数配分函数的二阶导数等于分布的方差。对于sof 阅读全文
posted @ 2025-03-09 14:55 最爱丁珰 阅读(49) 评论(0) 推荐(0)
摘要: 目录人类语言的成分单词短语名词短语(NP.)介词短语(PP.)动词短语(VP.)不同短语之间的结合依存关系依存关系的定义树库依存关系所导致的语言中的歧义树库所能提供的信息依存句法分析的方式符号学习方法深度学习方法具体步骤结果基于图的方法依存句法分析的评估方法 人类语言的成分 单词 有八个类别,常见的 阅读全文
posted @ 2025-03-09 10:04 最爱丁珰 阅读(181) 评论(0) 推荐(0)
摘要: 在 PyTorch 中,DataLoader 本身是一个可迭代对象(Iterable),而不是一个迭代器(Iterator)。两者的关键区别在于: 1. 可迭代对象 vs. 迭代器的区别 可迭代对象(Iterable) 任何实现了 __iter__() 方法的对象,例如列表、元组、DataLoade 阅读全文
posted @ 2025-03-08 19:46 最爱丁珰 阅读(72) 评论(0) 推荐(0)
上一页 1 ··· 24 25 26 27 28 29 30 31 32 ··· 132 下一页