LLM资料整理

框架：

1、https://github.com/LianjiaTech/BELLE

　　支持Docker

2、https://github.com/vllm-project/vllm

3、https://github.com/hiyouga/LLaMA-Factory/

　　一个训练框架，比起BELLE来说bug会少一点，但是不支持docker

数据集：

思路：

　　训模型的时候可以先考虑一下是个通用任务还是特定任务，用LORA、P-Tuning还是全量微调，参考Tuning系列论文笔记 - 知乎 (zhihu.com)。

posted on 2023-10-29 17:39 穷酸秀才大草包阅读(284) 评论(0) 收藏举报

刷新页面返回顶部

穷酸秀才大艹包