2023 年 11月 2 日随笔档案 - 高颜值的殺生丸

2023年11月2日

使用单卡qlora混合精度训练大模型chatGLM2-6b，解决qlora loss变成nan的问题！

摘要：最近新换了工作，以后的工作内容会和大模型相关，所以先抽空跑了一下chatGLM2-6b的demo，使用Qlora或lora微调模型今天简单写个文档记录一下，顺便也是一个简单的教程，并且踩了qlora loss变成nan训练不稳定的问题本教程并没有写lora的原理，需要的话自行查阅 1.chatG 阅读全文

posted @ 2023-11-02 11:31 高颜值的殺生丸阅读(1542) 评论(0) 推荐(0)

点此进入CSDN

高颜值的殺生丸

博主擅长python和c++，从事人工智能领域自然语言处理和图像识别方面的工作，欢迎大家来讨论交流

作者信息

昵称：

园龄：4年6个月

粉丝：1209

QQ：522414928