摘要:
大型“指令调优”语言模型在新任务上展现了Zero-shot的卓越能力,但严重依赖于人类编写的指令数据,而这些数据在数量、多样性和创造性方面都是有限的。 斯坦福科研人员引入了self-instruction框架,提高指令遵循能力来自我迭代进化,与InstructGPT的性能相当,相比原始GPT3提升3 阅读全文
posted @ 2023-03-14 17:54
写bug的程旭源
阅读(43)
评论(0)
推荐(0)
浙公网安备 33010602011771号