深度学习-pyTorch - 随笔分类(第4页) - lipu123

GoogLeNet

摘要：# Inception块当时有个疑问$1 * 1$、$3 * 3$、$5 * 5$、$Max pooling$、$Multiple 1 * 1$，到底用那个好呢？ ![image](https://img2023.cnblogs.com/blog/1914163/202308/1914163-20 阅读全文

posted @ 2023-08-17 11:07 lipu123

pytorch-NiN模型

摘要：LeNet、AlexNet和VGG都有⼀个共同的设计模式：通过一系列的卷积层与汇聚层来提取空间结构特征,然后通过全连接层对特征的表征进行处理。然而，如果使用了全连接层，可能会完全放弃表征的空间结构。NiN提供了⼀个非常简单的解决方案：在每个像素的通道上分别使用多层感知机。还有一个问题就是全连接层可能阅读全文

posted @ 2023-08-16 17:24 lipu123

pytorch-使用块的网络（VGG）

摘要：# VGG块经典卷积神经网络的基本组成部分是下面的这个序列： 1. 带填充以保持分辨率的卷积层； 2. 非线性激活函数，如ReLU； 3. 汇聚层，如最大汇聚层。而⼀个VGG块与之类似，由⼀系列卷积层组成，后面再加上用于空间下采样的最大汇聚层。原文中作者使用3 × 3卷积核、填充为1（保持高度和阅读全文

posted @ 2023-08-16 11:17 lipu123

pytorch-AlexNet

摘要：在上世纪90年代初到2012年之间的大部分时间里，神经网络往往被其他机器学习方法超越。深度卷积神经网络的突破出现在2012年。突破可归因于两个关键因素。 * 数据 * 硬件（GPU） ![image](https://img2023.cnblogs.com/blog/1914163/202308/1 阅读全文

posted @ 2023-08-16 09:36 lipu123

pytorch-LeNet

摘要：# LeNet 总体来看，LeNet（LeNet-5）由两个部分组成： • 卷积编码器：由两个卷积层组成; • 全连接层密集块：由三个全连接层组成。 ![image](https://img2023.cnblogs.com/blog/1914163/202308/1914163-2023081521 阅读全文

posted @ 2023-08-15 22:27 lipu123

卷积神经网络-池化层

摘要：# 池化层在现实生活中，如果我们拍摄黑白之间轮廓清晰的图像X，并将整个图像向右移动一个像素，即$Z[i, j]=X[i, j + 1]$，则新图像Z的输出可能大不相同。而在现实中，随着拍摄角度的移动，任何物体几乎不可能发生在同一像素上。即使用三脚架拍摄一个静止的物体，由于快门的移动而引起的相机振动阅读全文

posted @ 2023-08-15 10:22 lipu123

卷积神经网络-多输入多输出通道

摘要：彩色图像具有标准的RGB通道来代表红、绿和蓝。但是到目前为止，我们仅展示了单个输入和单个输出通道的简化例子。这使得我们可以将输入、卷积核和输出看作二维张量。当我们添加通道时，我们的输入和隐藏的表示都变成了三维张量。例如，每个RGB输入图像具有$3 × h × w$的形状。我们将这个大小为3的轴称为阅读全文

posted @ 2023-08-14 17:32 lipu123

卷积神经网络-填充和步幅

摘要：正如前面所说的：假设输入形状为$n_h × n_w$，卷积核形状为$k_h × k_w$，那么输出形状将是$(n_h − k_h + 1) × (n_w − k_w + 1)$。因此，卷积的输出形状取决于输入形状和卷积核的形状。假如有一个$240 × 240$像素的图像，经过10层$5 × 5$ 阅读全文

posted @ 2023-08-14 16:09 lipu123

pytorch-卷积层

摘要：# 二维卷积层计算 ![image](https://img2023.cnblogs.com/blog/1914163/202308/1914163-20230813203947264-374959244.png) * 输入 X : $n_h * n_w$ * 卷积核 W : $k_h * k_w$ 阅读全文

posted @ 2023-08-13 22:27 lipu123

pytorch-GPU

摘要：要想时使用GPU，首先要先安装CUDA和GPU版的torch # 计算设备我们可以指定用于存储和计算的设备，如CPU和GPU。默认情况下，张量是在内存中创建的，然后使⽤CPU计算它。在PyTorch中，CPU和GPU可以用torch.device('cpu') 和torch.device('cud 阅读全文

posted @ 2023-08-12 10:48 lipu123

pytorch-读写文件

摘要：# 加载和保存张量对于单个张量，我们可以直接调用load和save函数分别读写它们。这两个函数都要求我们提供一个名称，save要求将要保存的变量作为输入。 ``` import torch from torch import nn from torch.nn import functional a 阅读全文

posted @ 2023-08-12 09:39 lipu123

深度学习计算-层和块、参数管理、自定义层

摘要：# 层和块单个神经网络（1）接受一些输入；（2）生成响应的标量输出；（3）具有一组相关参数（parameters），更新这些参数可以优化某目标函数。然后，当考虑具有多个输出的网络时，我们利用矢量化算法来描述整层神经元。像单个神经元一样，层：（1）接受一组输入（2）生成相应的输出（3）阅读全文

posted @ 2023-08-11 23:34 lipu123

autogluon--自动机器学习快速训练模型

摘要：安装: ``` pip install autogluon ``` # 官网实例目的：预测一个人的收入是否超出5万美元 ``` from autogluon.tabular import TabularDataset, TabularPredictor ``` ## 数据读入这里的这个Tabul 阅读全文

posted @ 2023-08-11 16:14 lipu123

实战 Kaggle 比赛：预测房价

摘要：# 下载和缓存数据集 ``` import hashlib import os import tarfile import zipfile import requests ``` 下面的download函数用来下载数据集，将数据集缓存在本地目录（默认情况下为../data）中，并返回下载文件的名称。阅读全文

posted @ 2023-08-10 16:57 lipu123

pytorch-数值稳定性和模型初始化

摘要：# 神经网络的梯度考虑⼀个具有$t$层（注意这里的t表示的是层）、输入$x$和输出$y$的深层网络。每⼀层$t$由变换$f_t$定义，该变换的参数为权重$W^{(t)}$，其隐藏变量是$h^{(t)}$（令$h^{(0)} = x$）。我们的网络可以表示为： $$h^t=f_t(h^{t−1})\ 阅读全文

posted @ 2023-08-10 10:01 lipu123

pytorch-权重衰减、Dropout

摘要：# 正则化： **正则化：凡是能够减少泛化误差，而不是减少训练误差的方法就是正则化方法，也就是说能够减少过拟合的方法。** 在训练参数化机器学习模型时，权重衰减（weight decay）是广泛使用的正则化的技术之一，它通常也被称为L2正则化。 # 权重衰减在神经网络中我们有参数w和b，w是权重阅读全文

posted @ 2023-08-09 11:18 lipu123

模型选择、过拟合和欠拟合

摘要：# 训练误差和泛化误差 - **训练误差:模型在训练数据上的误差** - **泛化误差:模型在新数据上的误差** 例子:根据摸考成绩来预测未来考试分数 - 在过去的考试中表现很好(训练误差)不代表未来考试一定会好（泛化误差) - 学生A通过背书在摸考中拿到很好成绩 - 学生B知道答案后面的原因类似阅读全文

posted @ 2023-08-06 16:34 lipu123

pytorch-感知机与多层感知机

摘要：# 感知机早期1960年的感知机，每一根线就是一个权重。 ![image](https://img2023.cnblogs.com/blog/1914163/202308/1914163-20230805180516679-1949749893.png) 给定输入x,权重w,和偏移b,感知机输出: 阅读全文

posted @ 2023-08-05 22:26 lipu123

李沐-Softmax 回归模型

摘要：# 分类问题 ## 什么是分类问题回归 vs 分类 ·回归估计一个连续值 ·分类预测一个离散类别例如：![image](https://img2023.cnblogs.com/blog/1914163/202308/1914163-20230804150323504-36478924.png) 阅读全文

posted @ 2023-08-05 11:06 lipu123

pytorch-线性回归模型（李沐）

摘要：# 线性回归 - 一个简化模型假设1：影响房价的关键因素是卧室个数，卫生间个数和居住面积，记为$x_1,x_2,x_3$ 假设2：成交价是关键因素的加权和$y=w_1*x1+w_2*x_2+w_3*x_3+b$ ## 线性模型 - 给定n维输入 $x=[x_1,x_2,....x_n]^T$ - 阅读全文

posted @ 2023-08-03 23:20 lipu123 阅读(164) 评论(0) 推荐(0)

lipu123

随笔分类 - 深度学习&机器学习&机器学习 / 深度学习-pyTorch

公告