摘要:
Base/chat/instruct https://blog.csdn.net/qq_43127132/article/details/140447880 大模型库中的base、chat、instruct和4bit通常指的是不同类型或配置的预训练语言模型。它们的区别主要在于训练目标、用途和模型参数 阅读全文
posted @ 2024-09-10 22:52
lightsong
阅读(788)
评论(0)
推荐(0)
摘要:
支持能力 https://arxiv.org/pdf/2402.06196 能力增强方法 当我们谈论大模型时,应该关注哪些新能力? https://www.thepaper.cn/newsDetail_forward_22829654 能力一:涌现能力(emergent abilities) 涌现能 阅读全文
posted @ 2024-09-10 22:44
lightsong
阅读(119)
评论(0)
推荐(0)

浙公网安备 33010602011771号