大模型&智能体分享大纲
课程总览
· 时长:40小时(含10小时实践项目)
目标:掌握大模型全生命周期开发能力,具备独立优化和部署行业模型的能力
大模型篇
模块1:模型原理(5小时)
目标:掌握模型的基础原理更好的理解内容
1. Attention讲解(1h)
2. Self—Attention代码实现讲解(1h)
3. Transformer结构讲解(1h)
4. Transformer模块代码实现讲解(1h)
5. GPT、T5、deepseek大模型差异化对比(1h)
模块2:模型微调与部署(5小时)
目标:掌握不同场景下的模型优化策略
1.微调(2h)
微调是什么
为什么要微调
如何进行微调
2.Adapter(2h)
Adapter是什么
Adapter优势和不足
Adapter 微调实例
3.Prompt-Tuning(2h)
Prompt-Tuning是什么
P-Tuning
Prefix-Tuning
4.P-Tuning(4h)
P-Tuning是什么
P-Tuning的优势
P-Tuning的实现过程
LoRA原理以及案例
5.qwen模型微调及部署案例(1h)
qwen全参数微调
qwen的LoRA微调
6.deepseek模型微调及部署案例(1h)
deepseek全参数微调
deepseek的LoRA微调
模块3:模型评估与优化(5小时)
目标:建立科学的模型评价体系
1.评估指标体系(2h)
文本:BLEU/ROUGE/BERTScore
对话:USR/DSSM
2.评估内容具体方面(3h)
内容质量
内容安全性
内容可控性
内容个性化
业务价值评估
3.典型评估案例
医疗问诊模型
核心指标:诊断准确率(vs 主治医师)、用药建议合规率
特殊测试:罕见病案例处理能力、紧急情况响应速度
金融报告生成
核心指标:数据一致性(vs 原始财报)、关键指标覆盖率
特殊测试:市场敏感信息脱敏、多语言财报生成质量
教育辅导系统
核心指标:知识点覆盖度、学生留存率
特殊测试:错题解析逻辑性、个性化学习路径推荐合理性
模块4:行业案例解析(5h)
1. AIGC在搜索广告创意场景中的应用
创意大模型生成标题
基于原生化营销知识强化的开放式广告标题生成
基于LoRA的医疗行业生成式标题优化
2. 基于关键词文本生成大模型的广告检索
基于关键词文本生成的单任务建模
基于关键词生成多任务统一建模
基于百亿模型的关键词多结果生成任务
关键词受限生成和生成判别一体化
基于生成式模型的短语匹配任务建模
3.生成判别一体化大模型广告召回
字典树限定生成大模型
生成判别一体化模型
基于生成判别模型的短语匹配任务建模
4.基于生成式的端到端定向广告召回
基于广告主生成式检索
基于语义ID生成式检索
基于业务点生成式大模型
RAG(5h)
1. 背景介绍
1.1. 企业知识库特点
1.2. RAG 技术概述
1.3.RAG 的领域应用
2.RAG 整体优化方案介绍
2.1. 构建索引优化
2.2. 检索优化
2.3. 向量与排序模型微调
3.RAG 技术
3.1. 嵌入技术 Embedding 模型
3.2. 向量数据库
3.3. 业务数据向量化
4.1RAG在办公领域的企业实践
4.2图RAG在企业知识服务中的落地
Agent(15h)
大模型 Agent
Concepts 概念
OpenAI 函数智能体
OpenAI 函数调用
XML 智能体
JSON 结构智能体
ReAct 智能体
多自能体协同
记忆
本文来自博客园,作者:limingqi,转载请注明原文链接:https://www.cnblogs.com/limingqi/p/19480796
浙公网安备 33010602011771号