摘要: ### 1. Abstract 经过预训练的语言模型(PLM)表现出在通用领域理解文本的出色能力,同时在特定领域中表现不佳。**尽管在大型领域特定语料库上继续预训练是有效的,但调整领域上的所有参数是昂贵的**。在本文中,我们研究了是否可以通过只调整几个参数来有效地调整PLM。具体来说,我们将Tran 阅读全文
posted @ 2023-08-22 18:53 Tsukinousag1 阅读(182) 评论(0) 推荐(0) 编辑
摘要: ### 1. 准备数据 #### 1.1 预训练数据 目前看来数据部分是两类数据,一类是预训练数据 ![](https://img2023.cnblogs.com/blog/1745844/202305/1745844-20230524105616130-965772788.png) 需要下载对应的 阅读全文
posted @ 2023-05-24 22:57 Tsukinousag1 阅读(1025) 评论(0) 推荐(0) 编辑
摘要: 指令调优是一种新的学习范式,它可以根据指令指定的任务对预先训练好的语言模型进行微调,在各种自然语言处理任务中显示出良好的零目标性能。然而,对于视觉和多模态任务,它仍然没有被探索。在这项工作中,我们介绍了multiinstruction,这是第一个多模态指令调优基准数据集,由47个不同的多模态任务组成 阅读全文
posted @ 2023-04-11 15:53 Tsukinousag1 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 因果关系的self-attention,拥有前半句,生成后半句 解决了生成任务,如何解决噪声数据? BLIP 2 查询和当前这个文本最相关的图像信息是什么,同时把不想关的文本信息丢掉,目标文本指导查询图像 当前已经能从图像编码器中提取到更有用的视觉信息 阅读全文
posted @ 2023-03-18 22:01 Tsukinousag1 阅读(72) 评论(0) 推荐(0) 编辑
摘要: 我们研究了语言模型中的上下文学习(ICL)如何受到语义先验和输入标签映射的影响。我们在不同的模型族(GPT-3、InstructGPT、Codex、PaLM和Flan-PaLM)中研究了两种设置—带有翻转标签的ICL和带有语义无关标签的ICL。首先,在翻转标签的ICL上的实验表明,覆盖语义先验是模型 阅读全文
posted @ 2023-03-18 20:56 Tsukinousag1 阅读(123) 评论(0) 推荐(0) 编辑
摘要: TrainingArguments( _n_gpu=1,########################################GPU adafactor=False, adam_beta1=0.9, adam_beta2=0.999, adam_epsilon=1e-08, auto_fi 阅读全文
posted @ 2022-12-09 11:47 Tsukinousag1 阅读(101) 评论(0) 推荐(0) 编辑
摘要: 1. 代码链接 from torchtext.legacy import data from torchtext import datasets import torch import torch.nn as nn from transformers import BertTokenizer,Ber 阅读全文
posted @ 2022-01-29 19:20 Tsukinousag1 阅读(61) 评论(0) 推荐(0) 编辑
摘要: 1. 什么是BERT? 丢一段句子进去,然后BERT处理一个一个token到一个一个embedding “词”跟“字”的差别,就如“潮水”和“潮”,“水”的差别,因此中文bert更多的用的是字,而不是词,因为中文的词无法穷举 结构是多个transformer encoder部分的堆叠 因为这里的in 阅读全文
posted @ 2022-01-28 11:40 Tsukinousag1 阅读(190) 评论(0) 推荐(0) 编辑
摘要: 随机添加光点 class halo(): """ u:高斯分布的均值 sigma:方差 nums:在一张图片中随机添加几个光点 prob:使用halo的概率 """ def __init__(self,nums,u=0,sigma=0.2,prob=0.5): self.u=u#均值 self.si 阅读全文
posted @ 2021-11-11 21:15 Tsukinousag1 阅读(60) 评论(0) 推荐(0) 编辑
摘要: pil=Image.open('D:/100.jpg').convert('L') #PIL image转换为array img1=np.asarray(img) #修改图片的读取格式 img1.flags.writeable=True #将数组改写为读写模式 img1=img1.astype(np 阅读全文
posted @ 2021-11-11 21:09 Tsukinousag1 阅读(205) 评论(0) 推荐(0) 编辑