上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 14 下一页
摘要: 解密Prompt系列10. 思维链COT原理探究 这一章我们追本溯源,讨论下COT的哪些元素是提升模型表现的核心。结合两篇论文的实验结论,可能导致思维链比常规推理拥有更高准确率的因素有:思维链的推理过程会重复问题中的核心实体;正确逻辑推理顺序的引入 阅读全文
posted @ 2023-07-01 10:38 风雨中的小七 阅读(1745) 评论(0) 推荐(0)
摘要: 解密Prompt系列9. 模型复杂推理-思维链COT基础和进阶玩法 这一篇真的是解密prompt!我们会讨论下思维链(chain-of-Thought)提示词究竟要如何写,如何写的更高级,介绍包括few-shot,zero-shot,循序渐进式和一致性COT的写法 阅读全文
posted @ 2023-06-16 07:37 风雨中的小七 阅读(5820) 评论(3) 推荐(1)
摘要: 解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE 这一章我们聊聊有哪些方案可以不用微调直接让大模型支持超长文本输入,分别介绍显式搜索,unlimiformer隐式搜索,并行输入的PCW,和并行解码的NBCE方案 阅读全文
posted @ 2023-06-13 07:39 风雨中的小七 阅读(4203) 评论(0) 推荐(1)
摘要: 解密Prompt7. 偏好对齐RLHF-OpenAI·DeepMind·Anthropic对比分析 RLHF是针对有用,无害,事实性等原则,把模型输出和人类偏好进行对齐的一种方案。以OpenAI为基础,本章会对比DeepMind, Anthropic在RLHF步骤中的异同,试图理解RLHF究竟做了啥 阅读全文
posted @ 2023-05-23 07:35 风雨中的小七 阅读(1440) 评论(0) 推荐(2)
摘要: 解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~ 上一章介绍了如何基于APE+SELF自动化构建指令微调样本。这一章咱就把微调跑起来,主要介绍以Lora为首的低参数微调原理,环境配置,微调代码,以及大模型训练中显存和耗时优化的相关技术细节 阅读全文
posted @ 2023-04-29 14:42 风雨中的小七 阅读(4874) 评论(0) 推荐(2)
摘要: 解密prompt系列5. APE+SELF=自动化指令集构建代码实现 把AutomaticPromptEngineer指令逆向工程,SELFInstruct指令扩充组个CP,完全依LLM来构建指令微调样本集!在医疗领域经初步尝试了下,附代码和可视化应用 阅读全文
posted @ 2023-04-10 11:00 风雨中的小七 阅读(2059) 评论(0) 推荐(1)
摘要: 解密Prompt系列4. 升级Instruction Tuning:Flan/T0/InstructGPT/TKInstruct 这一章我们聊聊指令微调,模型还是那个熟悉的模型,核心的差异在于指令集和评估侧重点的不同,每个模型只侧重介绍差异点。按时间顺序分别是Flan,T0,InstructGPT, Tk-Instruct 阅读全文
posted @ 2023-03-26 19:35 风雨中的小七 阅读(2630) 评论(2) 推荐(1)
摘要: 解密Prompt系列3. 冻结LM微调Prompt: Prefix-Tuning & Prompt-Tuning & P-Tuning 这一章我们介绍在下游任务微调中固定LM参数,只微调Prompt的相关模型。这类模型的优势很直观就是微调的参数量小,能大幅降低LLM的微调参数量,是轻量级的微调替代品 阅读全文
posted @ 2023-03-10 08:40 风雨中的小七 阅读(5114) 评论(0) 推荐(0)
摘要: 解密Prompt系列2. 冻结Prompt微调LM: T5 & PET & LM-BFF 这一章我们介绍固定prompt微调LM的相关模型,他们的特点都是针对不同的下游任务设计不同的prompt模板,在微调过程中固定模板对预训练模型进行微调。以下按时间顺序介绍,支持任意NLP任务的T5,针对文本分类的两篇PET和LM-BFF。 阅读全文
posted @ 2023-02-24 08:32 风雨中的小七 阅读(2212) 评论(0) 推荐(2)
摘要: 解密Prompt系列1. Tunning-Free Prompt:GPT2 & GPT3 & LAMA & AutoPrompt 借着ChatGPT的东风,我们来梳理下prompt范式的相关模型,你还以其他形式看到过prompt概念,例如Demonstration,Instruction,In-Context learning,few-shot learning等等~开篇我们简单介绍下Prompt范式,并以其中的冻结参数Tunning-Free Prompt为线索串联GPT2,GPT3,LAMA和AutoPrompt这四种冻结参数的基础模型 阅读全文
posted @ 2023-02-10 08:53 风雨中的小七 阅读(3830) 评论(2) 推荐(0)
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 14 下一页