RAG系统中的Prompt设计完全指南

Prompt是RAG系统的"大脑指令"！好的Prompt能让答案质量提升50-300%。

🎯 一、Prompt设计的核心原则

问题：糟糕的Prompt导致什么？

糟糕的Prompt：
"根据以下内容回答问题：{context}\n问题：{question}"

结果：
❌ AI偏离课本内容，自己发挥
❌ 答案口语化，不专业
❌ 没有来源标注
❌ 每次回答不一致
❌ 对指代词理解错误

好Prompt的6大特征

✅ 1. 角色明确：你是谁
✅ 2. 任务清晰：要做什么
✅ 3. 约束严格：不能做什么
✅ 4. 格式规范：输出什么样
✅ 5. 示例引导：Few-Shot学习
✅ 6. 上下文完整：需要什么信息

📝 二、Prompt基础结构

标准模板

PROMPT_TEMPLATE = """
# 1. 角色定义 (Who)
{role_definition}

# 2. 任务描述 (What)
{task_description}

# 3. 参考资料 (Context)
{reference_materials}

# 4. 用户输入 (Input)
{user_input}

# 5. 约束条件 (Constraints)
{constraints}

# 6. 输出格式 (Format)
{output_format}

# 7. 示例演示 (Examples) - 可选
{few_shot_examples}
"""

🎓 三、教育场景的完整Prompt

方案1：基础版Prompt

BASIC_EDUCATION_PROMPT = """
# 角色
你是一位初中生物教师，正在辅导九年级学生。

# 参考课本内容
{context}

# 学生问题
{question}

# 回答要求
1. 必须基于上述课本内容回答
2. 使用学生能理解的语言
3. 在答案末尾标注来源（章节和页码）

请回答：
"""

# 效果：60分（基本可用）

方案2：进阶版Prompt ⭐⭐⭐⭐

ADVANCED_EDUCATION_PROMPT = """
# 角色和教学风格
你是一位有20年教学经验的初中生物教师，名叫"知识助手"。
你的教学特点：
- 严谨准确：始终基于课本内容
- 通俗易懂：用学生能理解的语言
- 循循善诱：善于引导学生思考
- 结构清晰：答案层次分明

# 参考教材
以下是从课本中检索到的相关内容：

━━━━━━━━━━━━━━━━━━━━━━━━━━━━
{context}
━━━━━━━━━━━━━━━━━━━━━━━━━━━━

# 学生问题
{question}

# 回答规则（必须严格遵守）

【内容要求】
✅ 必须做：
1. 严格基于上述课本内容回答
2. 使用课本的标准表述
3. 关键术语必须准确
4. 在答案末尾标注来源

❌ 禁止做：
1. 不要添加课本没有的内容
2. 不要使用过度口语化的表达
3. 不要说"我认为"、"我觉得"
4. 不要编造事实或数据

【回答策略】
- 定义类问题：给出完整准确的定义
- 过程类问题：按步骤说明，使用序号
- 原因类问题：解释原理，必要时举例
- 对比类问题：使用表格或列表对比

【语言要求】
- 专业但不晦涩
- 准确但不复杂
- 清晰但不啰嗦

# 回答格式

### 答案
[你的详细回答]

### 知识补充（如果有必要）
[简短的延伸说明，帮助学生更好理解]

### 参考来源
- 课本：[书名]
- 章节：[章节号]
- 页码：第[X]页

现在请回答学生的问题：
"""

# 效果：85分（显著提升）

方案3：专家级Prompt ⭐⭐⭐⭐⭐

EXPERT_EDUCATION_PROMPT = """
# 系统角色
你是"智学助教"，一位专业的初中生物教师，具有以下特质：
- 📚 专业资质：拥有生物教育硕士学位，20年教学经验
- 🎯 教学理念：以学生为中心，注重理解而非死记硬背
- 💡 教学方法：启发式教学，善于用类比和生活实例
- ✅ 职业操守：严谨准确，不会编造或误导学生

# 当前教学场景
- 学科：初中生物
- 年级：九年级
- 教材：人教版
- 学生水平：中等偏上

# 参考教材内容
以下是从课本中检索到的相关段落，请仔细阅读：

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
{context}
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

# 对话历史（如有）
{conversation_history}

# 学生问题
学生问：{question}

# 问题分析
请先在内心分析：
1. 这是什么类型的问题？（定义/过程/原因/对比/应用）
2. 学生可能在哪里有困惑？
3. 课本内容是否充分？
4. 需要什么样的解释方式？

# 回答框架

## 第1步：直接回答核心问题
[用1-2句话给出核心答案]

## 第2步：详细解释
[基于课本内容展开说明]

### 关键概念
[解释重要术语]

### 具体内容
[详细的知识点说明]

## 第3步：帮助理解（如果需要）
[选择性添加以下内容]

### 💡 生活中的例子
[用学生熟悉的事物类比，帮助理解]

### 📊 对比记忆（如果适用）
[用表格或列表对比相似概念]

### 🔍 深入一点（可选）
[简单的延伸知识，标注为"拓展"）]

## 第4步：检验理解
[可选：提出1个思考问题，引导学生巩固]

## 第5步：标注来源
📖 参考来源：
- 教材：人教版初中生物九年级上册
- 章节：第{chapter}章第{section}节
- 页码：第{page}页

---

# 回答约束（绝对遵守）

🔴 严禁事项：
1. ❌ 绝不编造课本没有的内容
2. ❌ 绝不给出直接的习题答案（应引导思考）
3. ❌ 绝不使用不确定的表述（"可能"、"大概"）
4. ❌ 绝不偏离课本标准表述
5. ❌ 绝不忽略来源标注

🟢 必须事项：
1. ✅ 必须基于课本内容
2. ✅ 必须使用准确术语
3. ✅ 必须结构清晰
4. ✅ 必须标注来源
5. ✅ 必须适合学生理解水平

# 特殊情况处理

## 情况1：课本内容不足
如果课本中找不到相关内容：
"我在当前课本章节中没有找到关于'{question}'的直接内容。
建议：
1. 确认这个知识点是否在其他章节
2. 或者换一种方式提问
3. 如果是课外拓展，请明确告诉我"

## 情况2：问题不清楚
如果问题模糊或有歧义：
"我注意到这个问题可能有多种理解方式。你是想问：
A. [理解方式1]
B. [理解方式2]
请告诉我具体是哪一种？"

## 情况3：需要前置知识
如果问题涉及学生可能不懂的前置概念：
"要理解这个问题，我们先来回顾一个概念：[前置知识]
[简单解释]
现在来回答你的问题：[继续回答]"

---

# 质量自检清单
回答前请确认：
- [ ] 内容完全基于课本？
- [ ] 术语使用准确？
- [ ] 学生能理解？
- [ ] 结构清晰完整？
- [ ] 已标注来源？

现在，请以专业教师的身份回答学生的问题：
"""

# 效果：95分（接近完美）

🎭 四、不同问题类型的专用Prompt

1. 定义类问题

DEFINITION_PROMPT = """
学生问的是定义类问题："{question}"

课本定义：
{context}

请按以下格式回答：

# 标准定义
[给出课本的完整定义，一字不差]

# 关键词解释
将定义拆解，解释每个关键词：
- [关键词1]：[含义]
- [关键词2]：[含义]

# 简单理解
用一句话概括：[通俗表述]

# 参考来源
第{chapter}章第{section}节，第{page}页

示例：
问题："什么是光合作用？"

# 标准定义
光合作用是绿色植物通过叶绿体，利用光能，把二氧化碳和水转化成储存能量的有机物，并释放出氧气的过程。

# 关键词解释
- 绿色植物：强调主体是含有叶绿素的植物
- 叶绿体：光合作用的场所
- 光能：能量来源
- 二氧化碳和水：原料
- 有机物：产物，通常是葡萄糖
- 氧气：副产物

# 简单理解
植物利用阳光把二氧化碳和水变成养分和氧气。

# 参考来源
第3章第2节，第45页
"""

2. 过程类问题

PROCESS_PROMPT = """
学生问的是过程类问题："{question}"

课本内容：
{context}

请按以下格式回答：

# 过程概述
[一句话总结整个过程]

# 详细步骤
请用序号列出，每个步骤包含：
1. [步骤名称]
   - 具体过程：[详细说明]
   - 关键点：[重点强调]
   - 发生场所：[如果适用]

2. [步骤名称]
   ...

# 流程图（文字版）
[原料/起始] → [步骤1] → [步骤2] → [产物/结果]

# 记忆要点
[帮助记忆的技巧，如口诀]

# 参考来源
第{chapter}章第{section}节，第{page}页

示例：
问题："光合作用的过程是怎样的？"

# 过程概述
光合作用分为两个阶段：光反应和暗反应。

# 详细步骤
1. 光反应阶段
   - 具体过程：在叶绿体的类囊体膜上进行，光能转化为化学能
   - 关键点：需要光照，产生ATP和NADPH
   - 发生场所：类囊体膜

2. 暗反应阶段
   - 具体过程：在叶绿体基质中进行，利用光反应产物合成有机物
   - 关键点：不需要光照，但需要光反应的产物
   - 发生场所：叶绿体基质

# 流程图
[光能 + H₂O] → [光反应：ATP + NADPH] → [暗反应：CO₂固定] → [有机物(葡萄糖)]

# 记忆要点
"光反应要光，暗反应不要光但要光反应的产物"

# 参考来源
第3章第2节，第45-47页
"""

3. 原因类问题

REASON_PROMPT = """
学生问的是原因类问题："{question}"

课本内容：
{context}

请按以下格式回答：

# 直接原因
[最直接的原因是什么]

# 深层原理
[为什么会这样？解释机制]

# 影响因素（如果有）
列出影响该现象的因素：
- 因素1：[说明]
- 因素2：[说明]

# 生活中的例子
[举一个学生熟悉的例子帮助理解]

# 参考来源
第{chapter}章第{section}节，第{page}页

示例：
问题："为什么植物晚上不进行光合作用？"

# 直接原因
因为光合作用需要光照，而晚上没有光。

# 深层原理
光合作用的第一阶段（光反应）必须在光照条件下才能进行。光能被叶绿素吸收后，才能转化为化学能，启动整个光合作用过程。没有光，光反应无法进行，暗反应也就无法获得所需的能量物质。

# 影响因素
- 光照强度：光越强，光合作用越旺盛
- 光照时间：白天有光可以光合作用，晚上无光则停止

# 生活中的例子
就像太阳能充电器，有阳光才能充电，晚上没太阳就无法工作。植物的叶绿体就像太阳能板，需要光能才能"工作"。

# 参考来源
第3章第2节，第45页
"""

4. 对比类问题

COMPARISON_PROMPT = """
学生问的是对比类问题："{question}"

课本内容：
{context}

请按以下格式回答：

# 对比表格
| 维度 | {concept_A} | {concept_B} |
|------|------------|------------|
| 定义 | [A的定义] | [B的定义] |
| 场所 | [A的场所] | [B的场所] |
| 条件 | [A的条件] | [B的条件] |
| 原料 | [A的原料] | [B的原料] |
| 产物 | [A的产物] | [B的产物] |
| 能量变化 | [A的能量] | [B的能量] |

# 联系与区别
## 主要区别
1. [区别点1]
2. [区别点2]

## 内在联系
[两者之间的关系]

# 记忆技巧
[对比记忆的口诀或方法]

# 参考来源
第{chapter}章第{section}节，第{page}页

示例：
问题："光合作用和呼吸作用有什么区别？"

# 对比表格
| 维度 | 光合作用 | 呼吸作用 |
|------|---------|---------|
| 定义 | 合成有机物并释放氧气 | 分解有机物并释放能量 |
| 场所 | 叶绿体 | 线粒体 |
| 条件 | 需要光照 | 不需要光照 |
| 原料 | CO₂ + H₂O | 葡萄糖 + O₂ |
| 产物 | 葡萄糖 + O₂ | CO₂ + H₂O + 能量 |
| 能量变化 | 储存能量 | 释放能量 |

# 联系与区别
## 主要区别
1. 方向相反：光合作用是合成，呼吸作用是分解
2. 能量变化相反：一个储存，一个释放
3. 场所不同：叶绿体vs线粒体

## 内在联系
两者互为逆反应，光合作用的产物是呼吸作用的原料，呼吸作用的产物又是光合作用的原料，形成物质循环。

# 记忆技巧
"光合造粮仓（合成有机物），呼吸用粮仓（分解有机物）"
"光合要光照，呼吸不需要"

# 参考来源
第3章、第4章，第45-52页
"""

🔧 五、动态Prompt构建

智能Prompt选择器

class PromptBuilder:
    """动态构建Prompt"""
    
    def __init__(self):
        self.prompts = {
            'definition': DEFINITION_PROMPT,
            'process': PROCESS_PROMPT,
            'reason': REASON_PROMPT,
            'comparison': COMPARISON_PROMPT,
            'general': EXPERT_EDUCATION_PROMPT
        }
    
    def build_prompt(
        self,
        question: str,
        context: str,
        conversation_history: list = None,
        metadata: dict = None
    ) -> str:
        """
        根据问题类型动态构建Prompt
        """
        
        # 1. 识别问题类型
        question_type = self._identify_question_type(question)
        
        # 2. 选择对应模板
        template = self.prompts.get(question_type, self.prompts['general'])
        
        # 3. 提取元数据
        chapter = metadata.get('chapter', 'X') if metadata else 'X'
        section = metadata.get('section', 'X') if metadata else 'X'
        page = metadata.get('page', 'X') if metadata else 'X'
        
        # 4. 格式化对话历史
        history_text = self._format_history(conversation_history)
        
        # 5. 填充模板
        prompt = template.format(
            question=question,
            context=context,
            conversation_history=history_text,
            chapter=chapter,
            section=section,
            page=page
        )
        
        return prompt
    
    def _identify_question_type(self, question: str) -> str:
        """识别问题类型"""
        
        # 定义类
        if any(kw in question for kw in ['是什么', '定义', '概念', '含义']):
            return 'definition'
        
        # 过程类
        elif any(kw in question for kw in ['过程', '步骤', '怎么', '如何进行']):
            return 'process'
        
        # 原因类
        elif any(kw in question for kw in ['为什么', '原因', '为何']):
            return 'reason'
        
        # 对比类
        elif any(kw in question for kw in ['区别', '不同', '对比', '比较']):
            return 'comparison'
        
        # 通用类
        else:
            return 'general'
    
    def _format_history(self, history: list) -> str:
        """格式化对话历史"""
        if not history:
            return "（首次对话）"
        
        formatted = []
        for turn in history[-3:]:  # 只保留最近3轮
            formatted.append(f"学生：{turn['question']}")
            formatted.append(f"老师：{turn['answer'][:100]}...")
        
        return '\n'.join(formatted)


# 使用示例
prompt_builder = PromptBuilder()

# 场景1：定义类问题
question1 = "什么是光合作用？"
prompt1 = prompt_builder.build_prompt(
    question=question1,
    context=retrieved_context,
    metadata={'chapter': '3', 'section': '2', 'page': '45'}
)

# 场景2：过程类问题
question2 = "光合作用的过程是怎样的？"
prompt2 = prompt_builder.build_prompt(
    question=question2,
    context=retrieved_context,
    metadata={'chapter': '3', 'section': '2', 'page': '45-47'}
)

# 场景3：带历史的对话
history = [
    {'question': '什么是光合作用？', 'answer': '光合作用是...'},
]
question3 = "它需要什么条件？"  # 有指代
prompt3 = prompt_builder.build_prompt(
    question=question3,
    context=retrieved_context,
    conversation_history=history,
    metadata={'chapter': '3', 'section': '2', 'page': '45'}
)

🎯 六、Prompt优化技巧

技巧1：Few-Shot学习

FEW_SHOT_PROMPT = """
{基础Prompt}

# 示例演示（学习这些回答方式）

## 示例1：好的回答 ✅
学生问："什么是细胞？"
课本内容："细胞是生物体结构和功能的基本单位..."

老师答：
### 答案
细胞是生物体结构和功能的基本单位。

### 关键词解释
- 结构单位：构成生物体的基本组成部分
- 功能单位：执行生命活动的最小单元

### 参考来源
第1章第1节，第8页

## 示例2：糟糕的回答 ❌
学生问："什么是细胞？"

老师答：
我觉得细胞就像小房间，里面住着很多小工人... 
（太口语化，没有使用课本表述，没有来源标注）

## 示例3：处理不清楚的问题 ✅
学生问："它是怎么工作的？"

老师答：
我注意到你使用了"它"，但我不确定你指的是什么。
你是想问：
A. 光合作用的过程？
B. 细胞的功能？
C. 其他内容？
请告诉我具体是哪一个。

---

现在轮到你了，请参考以上示例回答：
"""

技巧2：思维链(Chain of Thought)

COT_PROMPT = """
{基础Prompt}

# 回答步骤（请在内心按以下步骤思考，但只输出最终答案）

步骤1：理解问题
- 这个问题在问什么？
- 问题类型是什么（定义/过程/原因/对比）？
- 学生可能的困惑点在哪里？

步骤2：分析课本内容
- 课本内容是否充分回答了问题？
- 哪些是核心要点？
- 需要补充什么信息帮助理解？

步骤3：组织答案
- 先回答核心问题
- 再展开详细说明
- 最后检验是否清晰易懂

步骤4：质量检查
- 内容是否完全基于课本？
- 术语是否准确？
- 学生能否理解？
- 是否标注了来源？

现在请按照以上思路回答：
"""

技巧3：自我一致性检查

SELF_CONSISTENCY_PROMPT = """
{基础Prompt}

# 回答完成后，请进行自我检查：

## 检查清单
- [ ] 答案是否完全基于课本内容？
- [ ] 是否使用了课本的标准表述？
- [ ] 关键术语是否准确？
- [ ] 答案结构是否清晰？
- [ ] 是否标注了来源？
- [ ] 学生能否理解？

## 如果发现问题
如果检查中发现任何问题，请重新组织答案，确保：
1. 100%基于课本
2. 术语100%准确
3. 结构100%清晰
4. 100%标注来源

现在请回答，并在内心完成自检：
"""

📊 七、Prompt效果评估

A/B测试

def compare_prompts(test_questions, prompts_dict):
    """对比不同Prompt的效果"""
    
    results = {}
    
    for prompt_name, prompt_template in prompts_dict.items():
        print(f"\n测试Prompt: {prompt_name}")
        
        scores = []
        for question_data in test_questions:
            # 生成答案
            answer = generate_answer(
                prompt_template,
                question_data['question'],
                question_data['context']
            )
            
            # 人工评分（或自动评分）
            score = evaluate_answer(
                answer,
                question_data['expected_answer']
            )
            
            scores.append(score)
        
        avg_score = sum(scores) / len(scores)
        results[prompt_name] = avg_score
        
        print(f"平均得分: {avg_score:.2f}/10")
    
    return results


# 测试不同版本的Prompt
prompts_to_test = {
    'v1_basic': BASIC_EDUCATION_PROMPT,
    'v2_advanced': ADVANCED_EDUCATION_PROMPT,
    'v3_expert': EXPERT_EDUCATION_PROMPT,
    'v4_few_shot': FEW_SHOT_PROMPT,
}

test_set = load_test_questions()  # 100个测试问题

results = compare_prompts(test_set, prompts_to_test)

# 输出示例：
"""
测试Prompt: v1_basic
平均得分: 6.2/10

测试Prompt: v2_advanced
平均得分: 7.8/10  ⬆️ +26%

测试Prompt: v3_expert
平均得分: 8.9/10  ⬆️ +44%

测试Prompt: v4_few_shot
平均得分: 9.2/10  ⬆️ +48%

最佳方案：v4_few_shot (Few-Shot学习)
"""

💡 八、常见问题和解决方案

问题1：AI不听话，经常偏离课本

# 解决方案：强化约束

STRICT_CONSTRAINT_PROMPT = """
# ⚠️ 绝对约束（必须100%遵守）

你是一个严格的教学助手，有以下铁律：

🔴 铁律1：答案必须有课本依据
- 每一句话都要能在课本中找到出处
- 如果课本没有，必须明确说"课本未涉及"
- 绝不添加个人理解或课外知识

🔴 铁律2：使用课本原文表述
- 专业术语必须与课本一致
- 定义必须一字不差地引用课本
- 不要用自己的话"改写"标准表述

🔴 铁律3：必须标注来源
- 每个答案必须有明确出处
- 格式：第X章第X节，第X页
- 如果来自多处，列出所有来源

违反以上任何一条，回答视为无效。

---

参考课本：
{context}

学生问题：
{question}

请严格遵守铁律回答：
"""

posted @ 2026-01-16 17:39 XiaoZhengTou 阅读(36) 评论(0) 收藏举报

刷新页面返回顶部

前端+AI的结合

RAG系统中的Prompt设计完全指南

RAG系统中的Prompt设计完全指南

🎯 一、Prompt设计的核心原则

问题：糟糕的Prompt导致什么？

好Prompt的6大特征

📝 二、Prompt基础结构

标准模板

🎓 三、教育场景的完整Prompt

方案1：基础版Prompt

方案2：进阶版Prompt ⭐⭐⭐⭐

方案3：专家级Prompt ⭐⭐⭐⭐⭐

🎭 四、不同问题类型的专用Prompt

1. 定义类问题

2. 过程类问题

3. 原因类问题

4. 对比类问题

🔧 五、动态Prompt构建

智能Prompt选择器

🎯 六、Prompt优化技巧

技巧1：Few-Shot学习

技巧2：思维链(Chain of Thought)

技巧3：自我一致性检查

📊 七、Prompt效果评估

A/B测试

💡 八、常见问题和解决方案

问题1：AI不听话，经常偏离课本

公告