随笔档案「2021年9月」 - RowryCho

动手学深度学习 | 含并行连结的网络GoogLeNet/Inception V3 | 25

摘要：GoogLeNet 虽然现在NiN基本没有被使用，但是GoogLeNet还是被比较多的使用。这个网路出来的时候也是吓了大家一跳，就是做到了一个几乎快到100层的卷积层，基本可以认为是第一个超过百层的卷积神经网。虽然不是直接有100层深，但确实卷积个数超过了100。 NiN严重影响了GoogLeNe 阅读全文

posted @ 2021-09-30 20:37 RowryCho 阅读(477) 评论(0) 推荐(0)

动手学深度学习 | 循环神经网络RNN的实现 | 55

摘要：RNN从零开始实现简洁实现 QA num_step是做什么用的？就是那个T，那个时间维度。比如下面"你好，世界！"，输入这个句子有6个字符，那么这里的num_step/T=6。反过来可以认为这是一个6个样本的分类问题，就是每一个词都是要进行下一个词的预测。这是一个多分类问题，T=6，所以要做到阅读全文

posted @ 2021-09-29 14:24 RowryCho 阅读(335) 评论(0) 推荐(0)

动手学深度学习 | 网络中的网络NiN | 24

摘要：NiN NiN Network in Network，网络中的网络，这个网路现在用的不多，几乎很少被用到，但是它里面提出了比较重要的一些概念，在后面很多网络中都会持续的被用到。 MLP其实是不错的，但是缺点就是参数量实在是太大了！卷积层的参数相对于MLP会少很多，而且$1*1$卷积是可以达到于ML 阅读全文

posted @ 2021-09-28 22:30 RowryCho 阅读(310) 评论(0) 推荐(0)

动手学深度学习 | 循环神经网络RNN | 54

摘要：RNN 来将我们第一个对序列模型的神经网络——循环神经网络 RNN。 x是“你”，然后会去更新隐变量，要去预测“好”字。接下来观察到了“好”，更新隐变量后要输一个逗号。 $o_t$是来match$x_t$的输入，但是生成$o_t$的时候你是不能看到$x_t$的。也就是当前时刻的输出是为了预测当前时阅读全文

posted @ 2021-09-28 09:45 RowryCho 阅读(279) 评论(0) 推荐(0)

动手学深度学习 | 使用块的网络VGG | 23

摘要：VGG AlexNet最大的问题是什么呢？最大的问题就是长得不规则，虽然说它是一个变大的LeNet，但是感觉很随意，这里加一点，那里加一点。它的结构不够清晰，大家问了很多问题，为什么要这样，为什么要那样，要怎么变深怎么变宽都不知道。如果想要把网络变得更深更大，那么就要把网络变得更加regular点阅读全文

posted @ 2021-09-27 17:57 RowryCho 阅读(217) 评论(0) 推荐(0)

动手学深度学习 | 语言模型 | 53

摘要：语言模型一只猴子打字，就算是打到宇宙毁灭，他也打不出莎士比亚的文章。语言模型的核心是估计联合概率$p(x_1,...,x_t)$,序列模型的核心其实也就是预测整个文本序列出现的概率。我们使用一个最简单的计数模型来进行建模。一元只有一个变量，也就是自己，那么就可以认为每个变量都是独立的.. 这阅读全文

posted @ 2021-09-27 15:46 RowryCho 阅读(140) 评论(0) 推荐(0)

动手学深度学习 | 深度卷积神经网络AlexNet | 22

摘要：AlexNet AlexNet从2012年开始到今天，真正的引爆了深度学习的热潮。 2000年之前，最火的机器学习方法应该是核方法。特征提取 & 选择核函数来计算相关性 & 凸优化问题 & 漂亮的定理。使用核方法，可以变换这个空间，将这个空间拉成我们想要的样子，通过核函数计算之后就会成为一个凸优阅读全文

posted @ 2021-09-27 09:46 RowryCho 阅读(268) 评论(0) 推荐(0)

动手学深度学习 | 文本预处理 | 52

摘要：代码我们把文本当作一个时序序列，这也是整个自然语言处理干的事情。NLP说白了就是把文本拿过来，把里面的每一个字符，词当作一个变量，作为一个样本，然后样本之间是有时序信息的。可以认为文本就是一条很长的序列。文本预处理：核心思想就是如何把这些文本变成可以训练的东西。 tokens：这里是按照行来分词阅读全文

posted @ 2021-09-26 22:01 RowryCho 阅读(235) 评论(0) 推荐(0)

动手学深度学习 | 经典卷积神经网络LeNet | 21

摘要：LeNet 上面是LeNet的结构示意图。模型定义 net = nn.Sequential( # 这里输出是28*28，所以要padding=2，填充为32*32 nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(), nn.AvgPool 阅读全文

posted @ 2021-09-26 14:59 RowryCho 阅读(396) 评论(0) 推荐(0)

动手学深度学习 | 序列模型 | 51

摘要：序列模型我们这个是第四部分的一开始，叫做序列模型的东西，也就是 Sequence Model。其实就是整个RNN，整个NLP都是在处理一个序列。我们之前看到的图片是一个空间信息，而我们现在要考虑一个时间信息的模型，这个就是很不一样的地方。之前我们都是假设有t个独立的随机变量，也就是这张图片和上一阅读全文

posted @ 2021-09-26 08:38 RowryCho 阅读(355) 评论(0) 推荐(0)

动手学深度学习 | 池化层 | 20

摘要：池化层卷积层对于位置是非常敏感的！这里用检测垂直边缘作为例子，有的时候卷积对位置太敏感也不是好事，比如拍照的时候手抖之类的，边缘就不会那么整齐，所以有时候我们是需要一定程度的平移不变形的。池化操作也是使用滑动窗口来取值。上面实际上是没有padding的，所以大小不一致。其实应该是要paddi 阅读全文

posted @ 2021-09-25 09:12 RowryCho 阅读(374) 评论(0) 推荐(0)

动手学深度学习 | 卷积层里的多输入多输出通道 | 19

摘要：多输入输出通道通道数 channel，这个确实是大家通常回去仔细设的超参数。我感觉沐神想说的就是下面的说法，一个多通道的卷积核大小可以是$(k_h,k_w,input_{channel},output_{channel})$ 怎么理解呢？$(k_h,k_w)$就很好理解了，input_chann 阅读全文

posted @ 2021-09-23 15:52 RowryCho 阅读(1414) 评论(0) 推荐(0)

动手学深度学习 | 卷积层里的填充和步幅 | 18

摘要：填充和步幅先将两个控制卷积层输出大小的超参数：填充 & 步幅。上面是一个例子，如果是一张$3232$的图片，使用一个$55$的kernel来进行卷积，那么在第7层的时候图片大小会变成$4*4$,那么就不能在进行卷积了，换句话说就是，卷积层最多只能进行7层。那如果要做深应该怎么办？（其实深度学习阅读全文

posted @ 2021-09-22 21:15 RowryCho 阅读(606) 评论(0) 推荐(0)

动手学深度学习 | 卷积层 | 17

摘要：从全连接到卷积卷积是深度学习中最重要的概念之一，今天就学习下卷积的基本知识。 36M*100=3.6B。使用MLP来处理图片会遇到权重参数过多的问题。就是100个单元的单隐层，这里的权重都需要 3.6*1e9 * 4 / 1024 / 1024 / 1024 = 13.4GB的内存，这就需要很阅读全文

posted @ 2021-09-22 17:20 RowryCho 阅读(330) 评论(0) 推荐(0)

动手学深度学习 | 预测房价竞赛总结 | 16

摘要：竞赛总结我们讲知识，也不可能所有东西都cover到，让大家竞赛不是让大家去学某个特定的知识，而是说大家遇到一个问题，怎么去找一个解决方案。这一次的解决方案和下一次的会不一样，但是问题是你怎么去找这个东西，去问人也行，去搜索也行。私榜和公开榜是不一样的，大家能看到的都是公榜的（私榜就是为了防止大家阅读全文

posted @ 2021-09-22 15:02 RowryCho 阅读(532) 评论(0) 推荐(0)

动手学深度学习 | 使用和购买GPU | 15

摘要：使用GPU 其实如果没有钱买GPU的话，使用Google Colab也是一个不错的选择，大概是10 dollar一个月。算力其实是很贵的... 利用好算力是一件很重要的事情！关于Nvidia Driver too old的问题，如果是服务器的话，这里不要盲目的去更新显卡驱动，这样子会把别人的环境阅读全文

posted @ 2021-09-22 10:41 RowryCho 阅读(728) 评论(0) 推荐(0)

动手学深度学习 | PyTorch神经网络基础 | 14

摘要：模型构造这里主要是要继承nn.Module这个类，然后书写其中的__init__() & forward()方法即可。参数管理假设我们已经定义好我们的模型了，那我们参数应该怎么去访问？自定义层自定层其实和自定义网络没有什么区别，因为层也是nn.Module的一个子类。读写文件读写文件，阅读全文

posted @ 2021-09-22 08:17 RowryCho 阅读(148) 评论(0) 推荐(0)

动手学深度学习 | 实战：Kaggle房价预测+课程竞赛：加州2020年房价预测 | 13

摘要：实战Kaggle比赛：预测房价这里主要看自己训练的时候验证和真正提交的时候的差别。操作总结 # deeplearning 直接省去特征工程这些步骤 # 数据清洗也很简单：标准化 & 离散化课程竞赛：加州2020年房价预测沐神说他是使用了AutoML来训练的模型.. 现在的目标就是超过沐神就可阅读全文

posted @ 2021-09-21 20:48 RowryCho 阅读(459) 评论(0) 推荐(0)

动手学深度学习 | 数值稳定性+模型初始化和激活函数 | 12

摘要：数值稳定性数值的稳定性，这个是机器学习中比较重要的一点，特别是当你的神经网络变的很深的时候，你的数值变的非常容易不稳定。上面这里的t表示的层，而不是时间。$h^{t-1}$表示t-1层的输出。这里的y还不是预测值，因为还多了一个损失函数。向量对向量求导得到的一个矩阵，我们的主要问题就来自这个阅读全文

posted @ 2021-09-21 12:18 RowryCho 阅读(675) 评论(0) 推荐(0)

动手学深度学习 | 丢弃法 | 11

摘要：丢弃法 dropout可能会比之前讲的权重衰退效果更好，应用于防止模型过拟合。像上图，不管加入多少个点，都要让图片是可以看清的。使用有噪音的数据，就等价于一个叫做T正则。（正则就是是的权重的值不要太大，避免模型过拟合） **在数据中加入噪音，等价于一个正则。**跟之前加入的噪音不一样，之前是固定阅读全文

posted @ 2021-09-20 21:43 RowryCho 阅读(501) 评论(0) 推荐(0)

动手学深度学习 | 权重衰退 | 10

摘要：权重衰退如何控制模型的容量呢？模型参数个数参数的取值范围权重衰退就是控制参数的取值范围来控制模型容量的。上面的$||w||^2 \leq \theta$ ，则表示为每一个$w$都是要小于$\sqrt{\theta}$。其实也就是强行设置参数的取值的上限。加了这个罚之后，w确实会变小很多。阅读全文

posted @ 2021-09-20 17:04 RowryCho 阅读(750) 评论(0) 推荐(1)

动手学深度学习 | 模型选择+过拟合和欠拟合 | 09

摘要：模型选择我们其实关心的是泛化误差，并不太关心训练误差。训练误差：模拟考试成绩。泛化误差：真实考试成绩。所以我们会来计算我们训练误差和泛化误差呢？一般会有两种数据集，一个叫做验证集，一个叫做测试集。一个常犯的错误：验证集和训练集混在一起。经常在代码中的出现的test_dataset其实并不阅读全文

posted @ 2021-09-20 11:30 RowryCho 阅读(353) 评论(0) 推荐(0)

动手学深度学习 | 多层感知机+代码实现 | 08

摘要：感知机 1960年的“物理感知机”。感知机是人工智能最早最早的一个模型。感知机就是线性回归套了一层激活函数。因为感知机的输出只有一个元素，所以只能做为一个二分类的问题。可以理解为感知机使用了$l(y,x,w)=max(0,-y<w,x>)$这个损失函数。（只预测正确的）多层感知机多层感知阅读全文

posted @ 2021-09-19 21:50 RowryCho 阅读(1251) 评论(0) 推荐(0)

动手学深度学习 | Softmax回归+损失函数+图片分类数据集 | 07

摘要：Softmax回归首先简单理解softmax：就是将一个回归值转换成一个概率（也就是把一个实数，定在[0,1.]中） Softmax回归名字叫做回归，但其实是一个分类问题。（基本是个老师都会重复讲这句话）分类和回归的差别就在，回归只有一个输出，而分类是有多个输出。一般是有几个类别多少个输出。并阅读全文

posted @ 2021-09-19 19:28 RowryCho 阅读(1002) 评论(0) 推荐(0)

动手学深度学习 | 线性回归+基础优化算法 | 06

摘要：线性回归线性回归是机器学习中最基础的模型，也是后面我们理解所有模型的一个基础。之所以在深度学习中讲解线性模型，是因为它可以看作是一个单层神经网络（输出层可以不看做一个层，将权重和输入层看作一层）。训练数据当然是越多越好，但是也会受限于很多事情，房子售卖数据非常有限。所有我们有很多技术来处理，当阅读全文

posted @ 2021-09-19 09:38 RowryCho 阅读(689) 评论(0) 推荐(0)

动手学深度学习 | 自动求导 | 05

摘要：自动求导链式法则，如果扩展到向量，最最重要的还是看形状。 <x,w>这是内积的写法。自动求导涉及到一个计算图的概念，虽然Pytorch不用要求大家理解计算图，但是理解了对使用TensorFlow等都是有好处的。计算图其实本质上就和刚刚求导链式法则的过程。显示构造，就是先构造好这个公式，然后再阅读全文

posted @ 2021-09-18 12:08 RowryCho 阅读(644) 评论(0) 推荐(0)

动手学深度学习 | 矩阵计算 | 04

摘要：矩阵计算矩阵计算其实主要就是讲矩阵怎么求导数，对于机器学习和深度学习，我们要知道怎么求导数，因为所有的优化模型都是通过求导数来进行的。矩阵计算这部分的内容是在矩阵论中进行学习的，这里涉及到优化了... 将导数扩展到向量，通常我们叫做梯度。（下面就是有关矩阵论的内容了... 实在不明白就先跳过吧）阅读全文

posted @ 2021-09-17 16:42 RowryCho 阅读(296) 评论(0) 推荐(0)

动手学深度学习 | 线性代数 | 03

摘要：线性代数其实我们不需要太多线性代数的知识，但是还是稍微讲一下作为一个数学上的入门。向量的距离使用 ||vecotr|| 来表示。 ||a||2这个是L2范式，其实就是把向量里面的元素平方再求和，最后开方。向量的点积： a^T b 向量的正交： a^T b = 0 矩阵乘法，左边看行，右边看列（阅读全文

posted @ 2021-09-17 16:20 RowryCho 阅读(269) 评论(0) 推荐(0)

动手学深度学习 | 数据操作+数据预处理 | 02

摘要：数据操作图片是三维的： w*h*channel 图片集是四维的：batch_size*w*h*channel 一个视频批量是五维的：batch_size*t*w*h*channel 这里解释最后一个，行::3表示从第一个开始，每次步长为3，::2表示从第一个开始，每次步长为2 数据操作实现操作总阅读全文

posted @ 2021-09-17 10:47 RowryCho 阅读(179) 评论(0) 推荐(0)

动手学深度学习 | 安装 | 01

摘要：ssh rowrycho@ip_address # ssh连接服务器 sudo apt update # 更新一下 sudo apt install build-essential # 安装基础C/Cpp编译环境 wget miniconda安装包链接 bash xxx.sh # 安装minicon 阅读全文

posted @ 2021-09-16 21:47 RowryCho 阅读(119) 评论(0) 推荐(0)

动手学深度学习 | 目录 | 00

posted @ 2021-09-16 21:05 RowryCho 阅读(434) 评论(0) 推荐(0)

人工智能数学基础 | 特征值与矩阵分解 | 05

摘要：特征值与特征向量特征空间上图就是使用特征向量进行了压缩的图片（保留了主要的信息），虽然模糊了一些，但是图片基本是没有变化的。特征值分解奇异值分解（SVD）阅读全文

posted @ 2021-09-15 09:37 RowryCho 阅读(112) 评论(0) 推荐(0)

人工智能数学基础 | 线性代数基础 | 04

摘要：行列式矩阵矩阵的秩内积与正交阅读全文

posted @ 2021-09-14 20:58 RowryCho 阅读(49) 评论(0) 推荐(0)

人工智能数学基础 | 微积分 | 02

摘要：微积分的基本思想定积分牛顿—莱布尼茨公式阅读全文

posted @ 2021-09-14 16:36 RowryCho 阅读(74) 评论(0) 推荐(0)

RowryCho

好好写代码..

09 2021 档案

公告