摘要: 一、OpenCV简介 1.1 OpenCV是什么 OpenCV是一种开源的计算机视觉库,提供了广泛的图像处理和计算机视觉算法的实现。它最初是由英特尔开发的,现在已经成为计算机视觉领域最流行和广泛使用的开源库之一。OpenCV支持多种编程语言,包括C++、Python和Java等。它的主要特点是它提供 阅读全文
posted @ 2023-03-30 20:40 iSherryZhang 阅读(629) 评论(0) 推荐(0) 编辑
摘要: 其中,Transformer和BERT来自Google,GPT系列【GPT、GPT-1、GPT-2、GPT-3、ChatGPT、GPT-4】来自OpenAI。 GPT Paper名为Improving Language Understanding by Generative Pre-Training 阅读全文
posted @ 2023-03-28 20:51 iSherryZhang 阅读(1484) 评论(3) 推荐(2) 编辑
摘要: Transformer Transformer是完全由Attention和Self-Attention结构搭建的深度神经网络结构。 其中最为重要的就是Attention和Self-Attention结构。 Attention结构 Attention Layer接收两个输入$X = [x_1, x_2 阅读全文
posted @ 2023-03-21 18:10 iSherryZhang 阅读(236) 评论(0) 推荐(0) 编辑
摘要: Transformer在NLP任务中表现很好,但是在CV任务中应用还很有限,基本都是作为CNN的一个辅助,Vit尝试使用纯Transformer结构解决CV的任务,并成功将其应用到了CV的基本任务--图像分类中。 因此,简单而言,这篇论文的主旨就是,用Transformer结构完成图像分类任务。 图 阅读全文
posted @ 2023-02-27 14:28 iSherryZhang 阅读(521) 评论(0) 推荐(1) 编辑
摘要: 基于Stable Diffusion的哪些图像操作们: Text-To-Image generation:StableDiffusionPipeline Image-to-Image text guided generation:StableDiffusionImg2ImgPipeline In-p 阅读全文
posted @ 2023-02-24 11:17 iSherryZhang 阅读(2716) 评论(0) 推荐(0) 编辑
摘要: diffusers库的目标是: 将扩散模型(diffusion models)集中到一个单一且长期维护的项目中 以公众可访问的方式复现高影响力的机器学习系统,如DALLE、Imagen等 让开发人员可以很容易地使用API进行模型训练或者使用现有模型进行推理 diffusers的核心分成三个组件: P 阅读全文
posted @ 2023-02-23 11:36 iSherryZhang 阅读(10336) 评论(0) 推荐(0) 编辑
摘要: Diffusion相关技术最近也是非常火爆,看看招聘信息,岗位名称都由AI算法工程师变成了AIGC算法工程师,本周跟大家分享一些Diffusion算法相关的内容。 Window10环境下,Stable Diffusion的本地部署与效果展示 我选用的版本是: 在Windows下安装部署,只需要: I 阅读全文
posted @ 2023-02-13 17:21 iSherryZhang 阅读(3323) 评论(0) 推荐(0) 编辑
摘要: 在Python的使用中,我们经常会遇到这样的函数定义: def my_func(x, y, *args, **kwargs): for arg in args: print(arg) for key, value in kwargs.items(): print(f"{key}: {value}") 阅读全文
posted @ 2023-04-10 11:00 iSherryZhang 阅读(132) 评论(0) 推荐(0) 编辑
摘要: Python类 Python类的设计原则 封装(Encapsulation):Python类被设计用来将相关数据和行为封装到一个独立的单元中。 继承(Inheritance):Python支持继承,允许子类从父类继承属性和方法。有利于代码的复用和创建相关类的层次结构。 多态(Polymorphism 阅读全文
posted @ 2023-04-06 17:48 iSherryZhang 阅读(376) 评论(0) 推荐(2) 编辑
摘要: 155. 最小栈 设计一个支持 push ,pop ,top 操作,并能在常数时间内检索到最小元素的栈。 实现 MinStack 类: MinStack() 初始化堆栈对象。 void push(int val) 将元素val推入堆栈。 void pop() 删除堆栈顶部的元素。 int top() 阅读全文
posted @ 2023-03-31 20:04 iSherryZhang 阅读(42) 评论(0) 推荐(0) 编辑
摘要: 14. 最长公共前缀 编写一个函数来查找字符串数组中的最长公共前缀。 如果不存在公共前缀,返回空字符串 ""。 输入:strs = ["flower","flow","flight"] 输出:"fl" 思路解析 string longestCommonPrefix(vector<string>& s 阅读全文
posted @ 2023-03-24 17:17 iSherryZhang 阅读(77) 评论(0) 推荐(0) 编辑
摘要: Seq2Seq + Attention Seq2Seq模型,有一个Encoder和一个Decoder,默认认为Encoder的输出状态h_m包含整个句子的信息,作为Decoder的输入状态s_0完成整个文本生成过程。这有一个严重的问题就是,最后的状态不能记住长序列,也就是会遗忘信息,那么Decode 阅读全文
posted @ 2023-03-17 22:16 iSherryZhang 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 88. 合并两个有序数组 给你两个按 非递减顺序 排列的整数数组 nums1 和 nums2,另有两个整数 m 和 n ,分别表示 nums1 和 nums2 中的元素数目。 请你 合并 nums2 到 nums1 中,使合并后的数组同样按 非递减顺序 排列。 注意:最终,合并后数组不应由函数返回, 阅读全文
posted @ 2023-03-17 16:55 iSherryZhang 阅读(95) 评论(0) 推荐(0) 编辑
摘要: MidJourney简介 MidJourney是什么? 我们来看看维基百科给出的解释: Midjourney是一个由同名研究实验室开发的人工智能程式,可根据文本生成图像,于2022年7月12日进入公开测试阶段,使用者可透过Discord的机器人指令进行操作。该研究实验室由Leap Motion的创办 阅读全文
posted @ 2023-03-03 17:47 iSherryZhang 阅读(2103) 评论(0) 推荐(1) 编辑