随笔分类 -  大模型

上一页 1 2

GPT-4 Technical Report
摘要:Abstract 我们报告了GPT-4的开发,GPT-4是一种大规模的多模态模型,可以接受图像和文本输入并生成文本输出。尽管GPT-4在许多现实世界场景中的能力不如人类,但它在各种专业和学术基准上表现出人类水平的性能,包括通过了一次模拟的律师资格考试,分数在前10%左右。GPT-4是一个基于Tran 阅读全文

posted @ 2023-03-15 15:45 穷酸秀才大草包 阅读(532) 评论(0) 推荐(0)

ChatGPT: Optimizing Language Models for Dialogue
摘要:官网:https://openai.com/blog/chatgpt/ Methods 我们使用来自人类反馈的强化学习(RLHF)来训练这个模型,使用与InstructionGPT相同的方法,但数据收集设置略有不同。我们使用有监督的微调训练了一个初始模型:人工智能训练师提供对话,他们扮演用户和人工智 阅读全文

posted @ 2023-02-08 16:12 穷酸秀才大草包 阅读(717) 评论(0) 推荐(0)

Masked Autoencoders Are Scalable Vision Learners
摘要:MAE 阅读全文

posted @ 2022-12-02 10:02 穷酸秀才大草包 阅读(1140) 评论(0) 推荐(0)

Transformer中的嵌入与位置编码
摘要:绝对位置编码与相对位置编码: 实验分析非常精彩 | Transformer中的位置嵌入到底改如何看待? - 腾讯云开发者社区-腾讯云 (tencent.com) (16条消息) Transformer架构:位置编码_Jayson13的博客-CSDN博客_位置编码 1、Attention Is All 阅读全文

posted @ 2022-08-24 11:08 穷酸秀才大草包 阅读(599) 评论(0) 推荐(0)

Attention Is All You Need
摘要:Transformer 阅读全文

posted @ 2022-05-31 17:30 穷酸秀才大草包 阅读(152) 评论(0) 推荐(0)

上一页 1 2

导航