大模型 - 随笔分类(第2页) - 穷酸秀才大草包

GPT-4 Technical Report

摘要：Abstract 我们报告了GPT-4的开发，GPT-4是一种大规模的多模态模型，可以接受图像和文本输入并生成文本输出。尽管GPT-4在许多现实世界场景中的能力不如人类，但它在各种专业和学术基准上表现出人类水平的性能，包括通过了一次模拟的律师资格考试，分数在前10%左右。GPT-4是一个基于Tran 阅读全文

posted @ 2023-03-15 15:45 穷酸秀才大草包阅读(557) 评论(0) 推荐(0)

ChatGPT: Optimizing Language Models for Dialogue

摘要：官网：https://openai.com/blog/chatgpt/ Methods 我们使用来自人类反馈的强化学习（RLHF）来训练这个模型，使用与InstructionGPT相同的方法，但数据收集设置略有不同。我们使用有监督的微调训练了一个初始模型：人工智能训练师提供对话，他们扮演用户和人工智阅读全文

posted @ 2023-02-08 16:12 穷酸秀才大草包阅读(744) 评论(0) 推荐(0)

Masked Autoencoders Are Scalable Vision Learners

摘要：MAE 阅读全文

posted @ 2022-12-02 10:02 穷酸秀才大草包阅读(1187) 评论(0) 推荐(0)

Transformer中的嵌入与位置编码

摘要：绝对位置编码与相对位置编码：实验分析非常精彩 | Transformer中的位置嵌入到底改如何看待？ - 腾讯云开发者社区-腾讯云 (tencent.com) (16条消息) Transformer架构：位置编码_Jayson13的博客-CSDN博客_位置编码 1、Attention Is All 阅读全文

posted @ 2022-08-24 11:08 穷酸秀才大草包阅读(607) 评论(0) 推荐(0)

Attention Is All You Need

摘要：Transformer 阅读全文

posted @ 2022-05-31 17:30 穷酸秀才大草包阅读(160) 评论(0) 推荐(0)

穷酸秀才大艹包

随笔分类 - 大模型

导航

公告