摘要: permute的中文含义是:置换 这个就已经解释了一半了。 他的功能就是把一个多维张量的维度进行调换。 对于一个2维张量来说,例如: a=torch.rand(2,3). 那么代码a.permute(1,0)就相当于a.T 对于一个三维张量来说,例如: a=torch.rand(2,3,4) 代码a 阅读全文
posted @ 2024-10-24 11:28 Cooker2008 阅读(492) 评论(0) 推荐(1)
摘要: 当学习率设置的过小时,收敛过程将变得十分缓慢。且容易陷入局部最优解出不来。而当学习率设置的过大时,梯度可能会在最小值附近来回震荡,甚至可能无法收敛。 其实可以理解为,最优解收敛时的步长单位,如果你希望结果更精确一些,就应该把学习率调低,当然这样样的结果是训练时间的增长。 阅读全文
posted @ 2024-10-23 11:46 Cooker2008 阅读(22) 评论(0) 推荐(0)
摘要: 最近邻 适用于小型数据集,是很好的基准模型,很容易解释。 线性模型 非常可靠的首选算法,适用于非常大的数据集,也适用于高维数据。 朴素贝叶斯 只适用于分类问题。比线性模型速度还快,适用于非常大的数据集和高维数据。精度通 常要低于线性模型。 决策树 速度很快,不需要数据缩放,可以可视化,很容易解释。 阅读全文
posted @ 2024-10-22 09:35 Cooker2008 阅读(67) 评论(0) 推荐(0)
摘要: *不需要单独安装巨大的CUDA安装包, 先确保你的显卡是支持GPU运算的, 再安装好anaconda 确保没有安装:pytorch torchvision torchaudio这三个模块 然后在anaconda中的命令行输入:conda install pytorch torchvision tor 阅读全文
posted @ 2024-10-22 07:51 Cooker2008 阅读(239) 评论(0) 推荐(0)