会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
点此进入CSDN
你的浏览器不支持播放哦!!nuttertools 您的浏览器不支持该播放!
高颜值的殺生丸
博主擅长python和c++,从事人工智能领域自然语言处理和图像识别方面的工作,欢迎大家来讨论交流
博客园
首页
联系
管理
2023年11月2日
使用单卡qlora混合精度训练大模型chatGLM2-6b,解决qlora loss变成nan的问题!
摘要: 最近新换了工作,以后的工作内容会和大模型相关,所以先抽空跑了一下chatGLM2-6b的demo,使用Qlora或lora微调模型 今天简单写个文档记录一下,顺便也是一个简单的教程,并且踩了qlora loss变成nan训练不稳定的问题 本教程并没有写lora的原理,需要的话自行查阅 1.chatG
阅读全文
posted @ 2023-11-02 11:31 高颜值的殺生丸
阅读(1542)
评论(0)
推荐(0)
作者信息
昵称:
刘新宇
园龄:4年6个月
粉丝:1209
QQ:522414928