摘要: VIT主要用于分类任务 一、VIT,即纯transformer模型 图1 VIT 架构 VIT模型的架构如图1所示。主要分为三个步骤: 1. 首先将输入的图片分成patches(如16*16的patch),然后将每个patch输入到Embedding层(即Linear Projection of F 阅读全文
posted @ 2023-07-03 22:11 指间的执着 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 如图1所示,强化学习中,state是环境的状态,就是observation。 图1 强化学习 一、Policy based approach learning an actor The policy based approach is to learn an actor (agent or poli 阅读全文
posted @ 2023-06-24 19:49 指间的执着 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 1. GAN原理 如图1、2所示,GAN包括一个生成器Generator和一个判别器Discriminator。其中,Generator是根据输入的一个vector生成一个图片,而判别器是将生成的图片输入网络,输出该图片为真实图片的概率。 图1 Generator 图2 Discriminator 阅读全文
posted @ 2022-02-16 11:13 指间的执着 阅读(114) 评论(0) 推荐(0) 编辑
摘要: VAE学习总结 VAE是变分推断(variational inference )以及自编码器(Auto-encoder)的组合,是一种非监督的生成模型。 图1 自编码器(Auto-encoder) 其中,自编码器(Auto-encoder)的结构如图1所示。由Encoder和Decoder组成,其中 阅读全文
posted @ 2022-02-15 23:04 指间的执着 阅读(920) 评论(0) 推荐(0) 编辑
摘要: 一、Batch Normalization(批量标准化)的介绍以及理解 在神经网络中,在每一层上,通常是将该层的输入乘以权重矩阵加上偏移值,然后将计算结果使用激活函数进行非线性变换。但是随着网络深度的增加,其激活函数的输入值(W*X+B)的分布会发生变化。 可能会向激活函数取值的饱和区域延伸(比如: 阅读全文
posted @ 2021-02-15 09:07 指间的执着 阅读(60) 评论(0) 推荐(0) 编辑
摘要: 卷积神经网络是一类用于处理网格化(例如:图像)的神经网络,循环神经网络是一类用于处理序列数据的神经网络。 如图1所示是最简单的RNN的网络结构。RNN的输入是前一层的一个输出和当前时刻的的输入。RNN的网络结构如图1所示: 图1 RNN网络结构 这里的U、V是相同的,即权值共享。 长期依赖问题: 经 阅读全文
posted @ 2021-02-05 22:03 指间的执着 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 一、训练加速 多GPU训练: 1.1 基于数据的并行 模型平均(Model Average)、同步随机梯度下降(SSGD)、异步随机梯度下降(ASGD) 模型平均(Model Average) 每个Client训练平均的训练数据,每个batch更新一个模型,然后分别将模型发送给Server,Serv 阅读全文
posted @ 2021-02-05 22:01 指间的执着 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 一、NumPy介绍 NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。 NumPy是一个开源的Python科学数据库,用于快速处理任意维度的数据。NumPy支持常见的数组和矩阵操作,使用Num 阅读全文
posted @ 2021-02-05 22:00 指间的执着 阅读(64) 评论(0) 推荐(0) 编辑
摘要: 一、图像读入、显示和保存 1.读入图像 retval = cv2.imread(文件名[, 显示控制参数]) 显示控制参数参数如下: cv2.IMREAD_UNCHANGED cv2.IMREAD_GRAYSCALE cv2.IMREAD_COLOR …… 2.显示图像 None = cv2.ims 阅读全文
posted @ 2020-05-18 21:52 指间的执着 阅读(672) 评论(0) 推荐(0) 编辑
摘要: 1.项目简介 本项目实现人脸识别系统。 项目基本思路如下:对于输入的图片,首先通过MTCNN网络进行人脸检测,获取到人脸图片;并使用MTCNN网络检测到的人脸关键点信息通过仿射变换进行人脸对齐;然后使用insightface进行人脸特征提取,比较数据库中的数据,识别出人脸。项目结构如图所示: 图1 阅读全文
posted @ 2020-03-31 22:48 指间的执着 阅读(808) 评论(0) 推荐(0) 编辑