2025 年 8月 9 日随笔档案 - 有何m不可

2025年8月9日

使用Hugging Face微调开源LLM（2025年）

摘要：大型语言模型（LLMs）在2024年继续发挥其重要作用，多个重大进展完全超越了之前的模型。重点继续放在像Meta、Qwen或Google这样的公司开发的更小、更强大的模型上。这些模型不仅变得更加强大，而且更加高效。我们得到了参数量小至1B的Llama模型，其性能甚至超越了Llama 2 13B。 L 阅读全文

posted @ 2025-08-09 17:54 有何m不可阅读(160) 评论(0) 推荐(0)

使用TRL微调LLM(2024年)

摘要：大型语言模型（LLMs）在过去一年中取得了许多进展。我们从现在ChatGPT的竞争对手发展到一个包含Meta AI的Llama 3，Mistral的Mistral和Mixtral模型，TII的Falcon，以及许多其他模型。本文博客将指导您如何使用Hugging Face进行开放LLM的微调TRL 阅读全文

posted @ 2025-08-09 13:00 有何m不可阅读(98) 评论(0) 推荐(0)

gongzb

公告