iSherryZhang

[置顶] Transformer的Pytorch实现【1】

摘要：使用Pytorch手把手搭建一个Transformer网络结构并完成一个小型翻译任务。首先，对Transformer结构进行拆解，Transformer由编码器和解码器（Encoder-Decoder）组成，编码器由Multi-Head Attention + Feed-Forward Netwo 阅读全文

posted @ 2024-10-12 21:01 iSherryZhang 阅读(1009) 评论(0) 推荐(0)

[置顶] 三分钟速览GPT系列原理

摘要：其中，Transformer和BERT来自Google，GPT系列【GPT、GPT-1、GPT-2、GPT-3、ChatGPT、GPT-4】来自OpenAI。 GPT Paper名为Improving Language Understanding by Generative Pre-Training 阅读全文

posted @ 2023-03-28 20:51 iSherryZhang 阅读(1942) 评论(3) 推荐(2)

[置顶] 王树森Transformer学习笔记

摘要： Transformer Transformer是完全由Attention和Self-Attention结构搭建的深度神经网络结构。其中最为重要的就是Attention和Self-Attention结构。 Attention结构 Attention Layer接收两个输入$X = [x_1, x_2 阅读全文

posted @ 2023-03-21 18:10 iSherryZhang 阅读(445) 评论(0) 推荐(0)

[置顶] ViT简述【Transformer】

摘要： Transformer在NLP任务中表现很好，但是在CV任务中应用还很有限，基本都是作为CNN的一个辅助，Vit尝试使用纯Transformer结构解决CV的任务，并成功将其应用到了CV的基本任务--图像分类中。因此，简单而言，这篇论文的主旨就是，用Transformer结构完成图像分类任务。图阅读全文

posted @ 2023-02-27 14:28 iSherryZhang 阅读(822) 评论(0) 推荐(1)

[置顶] Diffusers中基于Stable Diffusion的哪些图像操作

摘要：基于Stable Diffusion的哪些图像操作们： Text-To-Image generation：StableDiffusionPipeline Image-to-Image text guided generation：StableDiffusionImg2ImgPipeline In-p 阅读全文

posted @ 2023-02-24 11:17 iSherryZhang 阅读(3799) 评论(0) 推荐(1)

[置顶] Diffusers库的初识及使用

摘要： diffusers库的目标是：将扩散模型（diffusion models）集中到一个单一且长期维护的项目中以公众可访问的方式复现高影响力的机器学习系统，如DALLE、Imagen等让开发人员可以很容易地使用API进行模型训练或者使用现有模型进行推理 diffusers的核心分成三个组件： P 阅读全文

posted @ 2023-02-23 11:36 iSherryZhang 阅读(16749) 评论(0) 推荐(1)

[置顶] Window10环境下，Stable Diffusion的本地部署与效果展示

摘要： Diffusion相关技术最近也是非常火爆，看看招聘信息，岗位名称都由AI算法工程师变成了AIGC算法工程师，本周跟大家分享一些Diffusion算法相关的内容。 Window10环境下，Stable Diffusion的本地部署与效果展示我选用的版本是：在Windows下安装部署，只需要： I 阅读全文

posted @ 2023-02-13 17:21 iSherryZhang 阅读(3513) 评论(0) 推荐(0)

2023年4月10日

Python中的args和kwargs

摘要：在Python的使用中，我们经常会遇到这样的函数定义： def my_func(x, y, *args, **kwargs): for arg in args: print(arg) for key, value in kwargs.items(): print(f"{key}: {value}") 阅读全文

posted @ 2023-04-10 11:00 iSherryZhang 阅读(257) 评论(0) 推荐(0)

2023年4月6日

Python中，类的特殊方法与内置函数的关联

摘要： Python类 Python类的设计原则封装（Encapsulation）：Python类被设计用来将相关数据和行为封装到一个独立的单元中。继承（Inheritance）：Python支持继承，允许子类从父类继承属性和方法。有利于代码的复用和创建相关类的层次结构。多态（Polymorphism 阅读全文

posted @ 2023-04-06 17:48 iSherryZhang 阅读(659) 评论(0) 推荐(2)

2023年3月31日

Leetcode Practice --- 栈和队列

摘要： 155. 最小栈设计一个支持 push ，pop ，top 操作，并能在常数时间内检索到最小元素的栈。实现 MinStack 类: MinStack() 初始化堆栈对象。 void push(int val) 将元素val推入堆栈。 void pop() 删除堆栈顶部的元素。 int top() 阅读全文

posted @ 2023-03-31 20:03 iSherryZhang 阅读(89) 评论(0) 推荐(0)

2023年3月30日

一文总结你需要的OpenCV操作

摘要：目录一、OpenCV简介1.1 OpenCV是什么1.2 安装及使用二、图像的基础2.1 成像原理2.2 图像格式2.3 颜色空间三、OpenCV基础操作3.1 图像的读取、显示、保存3.2 通道转换三、OpenCV常见图像处理3.1 在图像上绘制几何图像及添加文字3.2 图像的几何变换3.3 图像阅读全文

posted @ 2023-03-30 20:40 iSherryZhang 阅读(1224) 评论(0) 推荐(1)

2023年3月24日

Leetcode Practice -- 字符串

摘要： 14. 最长公共前缀编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀，返回空字符串 ""。输入：strs = ["flower","flow","flight"] 输出："fl" 思路解析 string longestCommonPrefix(vector<string>& s 阅读全文

posted @ 2023-03-24 17:17 iSherryZhang 阅读(136) 评论(0) 推荐(0)

2023年3月17日

王树森Attention与Self-Attention学习笔记

摘要： Seq2Seq + Attention Seq2Seq模型，有一个Encoder和一个Decoder，默认认为Encoder的输出状态h_m包含整个句子的信息，作为Decoder的输入状态s_0完成整个文本生成过程。这有一个严重的问题就是，最后的状态不能记住长序列，也就是会遗忘信息，那么Decode 阅读全文

posted @ 2023-03-17 22:16 iSherryZhang 阅读(272) 评论(0) 推荐(0)

Leetcode Practice -- 数组

摘要： 88. 合并两个有序数组给你两个按非递减顺序排列的整数数组 nums1 和 nums2，另有两个整数 m 和 n ，分别表示 nums1 和 nums2 中的元素数目。请你合并 nums2 到 nums1 中，使合并后的数组同样按非递减顺序排列。注意：最终，合并后数组不应由函数返回，阅读全文

posted @ 2023-03-17 16:55 iSherryZhang 阅读(136) 评论(0) 推荐(0)

公告