Stay Hungry,Stay Foolish!

摘要: Base/chat/instruct https://blog.csdn.net/qq_43127132/article/details/140447880 大模型库中的base、chat、instruct和4bit通常指的是不同类型或配置的预训练语言模型。它们的区别主要在于训练目标、用途和模型参数 阅读全文
posted @ 2024-09-10 22:52 lightsong 阅读(788) 评论(0) 推荐(0)
摘要: 支持能力 https://arxiv.org/pdf/2402.06196 能力增强方法 当我们谈论大模型时,应该关注哪些新能力? https://www.thepaper.cn/newsDetail_forward_22829654 能力一:涌现能力(emergent abilities) 涌现能 阅读全文
posted @ 2024-09-10 22:44 lightsong 阅读(119) 评论(0) 推荐(0)
千山鸟飞绝,万径人踪灭