2024-02-11 - ChatGLM部署和微调 - 卢菁
摘要
2024-02-11 周日 桑梓 晴
小记: 明知道 AI 将会颠覆一切,但是目前又是风平浪静。
课程内容
1. 大模型三要素
- 算法: 模型结构,训练方法;
- 数据: 数据和模型效果之间的关系,token 分词方法;
- 算力: 英伟达 GPU ,模型量化;
2. 大模型对话系统架构

3. 提示学习: 提示工程的支撑


4. 基础 prompt 提示

5. 高级 prompt 提示

6. 大模型内核: Transformer

7. 大模型的架构

8. 大模型调参难点
为什么很少直接微调?
- 参数多,内存不容易放下;
- 参数多,需要对应更大的数据;
- 参数多,不容易收敛;
- 参数多,调参时间过长;
9. 参数高效微调方法

10. 大数据类型

- BLOOM 大模型训练数据

-
PALM 大模型训练数据

-
常见英文数据集

- 常见中文数据集

11. 幂律

- 参数量和数据量之间的关系

-
大模型的分词

-
常见大模型词表

12. 算法并行

13. 模型压缩和加速


14. 英伟达历代产品架构

15. TensorCore(张量核心)

- 稀疏矩阵加速运算


16. 模型训练


- 知识压缩


- 审核系统

- 智能纠错


总结
后会无期,未来可期!

浙公网安备 33010602011771号