完整教程：prompt提示词工程---如何让大模型更听得懂人话

import openai
import json

openai.api_key = "YOUR_API_KEY"

state = {"intent": None, "food": None, "quantity": None, "time": None}
user_inputs = ["我想订餐", "要披萨", "两份", "下午六点送到"]

for text in user_inputs:
prompt = f"当前状态：{json.dumps(state)}。用户说：{text}。更新状态并仅返回JSON。"
resp = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[{"role": "user", "content": prompt}]
)
state = json.loads(resp.choices[0].message["content"].strip())
print(state)
'''
输出结果:
{'intent': 'order_food', 'food': None, 'quantity': None, 'time': None}
{'intent': 'order_food', 'food': 'pizza', 'quantity': None, 'time': None}
{'intent': 'order_food', 'food': 'pizza', 'quantity': 2, 'time': None}
{'intent': 'order_food', 'food': 'pizza', 'quantity': 2, 'time': '18:00'}
'''

2.5 基于DST写prompt的方式

核心思路：明确当前状态、用户输入，并要求模型「增量更新」关键信息，输出结构化结果。关键技巧：

献出当前对话状态的结构化格式（如 JSON）

强调「只更新变化的字段，保留已有正确信息」

明确需要跟踪的核心实体（如订机票场景的时间、地点、人数等）

你需要跟踪用户的对话状态，格式为 JSON，含有字段：intent（意图）、departure（出发地）、destination（目的地）、date（日期）。
当前状态：{"intent": "book_flight", "departure": "北京", "destination": null, "date": null}
用户输入："我要去上海，下周三出发"
请根据用户输入更新状态，只返回 JSON，不添加其他内容。

效果：模型会精准更新destination 和 date字段，避免覆盖已有正确的departure 信息。

3. NLU（将人话转为大模型能看懂的话）

3.1 定义

NLU（Natural Language Understanding，自然语言理解）是人工智能的一个分支，负责将人类的自然语言（如中文、英文）转换成机器能够理解和执行的结构化信息，比如意图和实体。它是对话系统、智能客服、语音助手等的核心模块。

3.2 例子

假设用户说：

“帮我订一张从北京到上海的高铁票，明天下午三点出发。”

NLU 可能会解析成：

JSON
{
"intent": "订高铁票",
"entities": {
"出发地": "北京",
"目的地": "上海",
"日期": "明天",
"时间": "下午三点"
}
}

3.3 NLU（自然语言理解）的 Prompt 设计

核心思路：明确要求模型提取「意图」和「实体」，并给出结构化输出格式，必要时提供示例。关键技巧：

定义清晰的意图类型（如「查询天气」「预订酒店」）

列出需要提取的实体类别（如时间、地点、数量）

用「少样本示例」引导模型理解格式（尤其对复杂场景）

任务：解析用户输入的意图和实体，输出 JSON。
意图包括：order_food（订餐）、inquire_price（询价）。
实体包括：food（食物）、num（数量）、time（时间）。

示例：
用户输入："我要2份汉堡，晚上7点送到"
输出：{"intent": "order_food", "entities": {"food": "汉堡", "num": 2, "time": "晚上7点"}}

用户输入："披萨多少钱一份？"
请输出 JSON：

效果：通过示例约束，模型能稳定识别意图和实体，减少格式错误。

4. 思维链（给模型提供推理过程）

4.1 定义

思维链是一种通过模拟人类逐步推理过程来提升模型困难问题解决能力的技术。它是一系列中间的推理步骤，通过让大模型逐步参与将一个麻烦问题分解为一步一步的子问题并依次进行求解的过程，其核心是让模型在输出最终答案前，显式生成中间的逻辑步骤，而非直接给出结论。

4.2 例子

零样本思维链：无需提供示例，直接通过指令引导模型生成推理步骤。例如问题 “小明有 12 个苹果，给了小红 5 个，之后又买了 3 个，现在他有多少个苹果？”，模型输出为 “小明原有 12 个苹果。送给小红 5 个后，剩余 12 - 5 =7 个。又买了 3 个后，总数为 7 + 3 = 10 个。答案：10 个苹果。” 这种方式适用于便捷任务，对于复杂问题可能因步骤缺失导致错误，但在该简单数学问题中，通过逐步推理，大模型能准确得出答案。

通过小样本思维链：通过给出少量带推理步骤的示例，引导模型模仿并生成答案。例如，先给出示例 1“问：小明有 5 个羽毛球，买了 2 管，每管 3 个，现在有多少个？答：5（原数量） + (2 × 3) = 11 个。” 和示例 2“问：自助餐厅有 23 个苹果，用掉 20 个后又买 6 个，现在有多少个？答：23 - 20 + 6 = 9 个。”，然后给出待解决问题 “问：商店上午卖出 8 杯咖啡，下午卖出的是上午的 2 倍，全天卖了多少杯？”，模型输出为 “上午卖出 8 杯。下午卖出 8 × 2 = 16 杯。全天共 8 + 16 = 24 杯。答案：24 杯。” 凭借这些示例，模型能够学习到推理的逻辑和步骤，从而在面对新困难时能更准确地进行推理和回答。

自一致性（Self - Consistency）：该方法会为问题生成多条不同的推理路径，并对生成的答案进行众数投票。例如对于难题 “小明有 12 个苹果，给了小红 5 个，又买了 3 个，现在有多少个？”，模型生成多条推理路径如 “12 - 5 + 3 = 10个 -> (12 - 5) + 3 = 10 -> 12 + 3 - 5 = 10 -> 12 - (5 + 3) = 4（错误路径）”，投票结果为 “10”（3 票），“4”（1 票），最终答案为 10 个苹果。此种方式可能减少单一路径偏差，提高大模型在复杂推理任务中的准确性和鲁棒性。

4.3 思维链（CoT）的 Prompt 设计

核心思路：强制模型输出「分步推理过程」，再给出最终答案，尤其适合逻辑题、数学题等复杂任务。关键技巧：

用指令引导分步思考（如「请一步一步分析」「先理清楚条件」）

提供带推理步骤的示例（小样本 CoT）

明确区分「推理过程」和「最终答案」

请解决以下问题，先一步一步分析，最后用「答案：」开头给出结果。
问题：一个商店有3箱苹果，每箱20个。卖出45个后，还剩多少个？

分析：
1. 先算总共有多少个苹果：3箱 × 20个/箱 = 60个
2. 卖出45个后，剩余数量 = 总数 - 卖出数 = 60 - 45 = 15个

答案：15

用户问："小明比小红大3岁，小红比小刚小5岁，谁最大？"
请先分析每个人的年龄关系，再给出结论。

效果：模型通过显式推理步骤减少跳跃性错误，尤其对多步骤难题准确率提升明显。

5. 自洽性（根据生成多种答案的众数来确定最后答案）

5.1 定义

自洽性是一种提升大模型推理准确性的手艺，通过对同一个问题生成多条不同的推理路径，然后对结果进行 "多数投票" 或综合分析，选择最一致的答案。

此种方法能有效减少单一路径可能产生的偏差或错误，特有适合数学推理、逻辑分析等复杂任务。

5.2 例子

难题：小明有 12 个苹果，送给小红 5 个，又买了 3 个，现在有多少个？

多条推理路径：

路径 1：12 - 5 = 7，7 + 3 = 10 → 答案：10

路径 2：12 + 3 = 15，15 - 5 = 10 → 答案：10

路径 3：5 - 3 = 2，12 - 2 = 10 → 答案：10

路径 4：12 - (5 + 3) = 4 → 答案：4（错误）

结果汇总：10（3 票），4（1 票）最终答案：10 个苹果

5.3 如何写 prompt 利用自洽性

import openai
import json
from collections import Counter

openai.api_key = "YOUR_API_KEY"

question = "小明有12个苹果，送给小红5个，又买了3个，现在有多少个？"

# 生成5条不同推理路径
n_samples = 5
prompt = f"请解决这个挑战，先分析推理步骤，最后用'答案：X'格式给出结果。\n问题：{question}"

answers = []
for i in range(n_samples):
resp = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[{"role": "user", "content": prompt}]
)
text = resp.choices[0].message["content"]
# 提取答案（假设最后一行是"答案：X"）
last_line = text.strip().split("\n")[-1]
if "答案：" in last_line:
ans = last_line.split("答案：")[-1].strip()
answers.append(ans)

# 多数投票
final_answer = Counter(answers).most_common(1)[0][0]
print(f"所有答案: {answers}")
print(f"最终答案: {final_answer}")

自洽性 prompt 关键技巧

多次采样：对同一问题生成多条独立推理路径

明确格式：要求模型用固定格式标记最终答案

结果汇总：借助投票或加权选择最一致的答案

提升多样性：可利用不同的 temperature 值或提示变体

6. 思维树

6.1 定义

一种让大模型在解决复杂挑战时，像树状结构一样并行探索多条推理路径的技术。不同于思维链（Chain of Thought）的线性推理，思维树允许模型：就是思维树

从一个问题出发，生成多个可能的思考方向

对每个方向进行深入探索

评估各路径的可行性，选择最优解

这种方法专门适合需要试错、回溯或多步规划的任务。

6.2 例子

问题：如何在 30 分钟内从公司回家，并准备一顿方便晚餐？

根节点：目标 - 30分钟内回家并准备晚餐

├─ 路径A：地铁回家
│ ├─ 检查地铁时刻表（2分钟）
│ ├─ 步行到地铁站（8分钟）
│ ├─ 地铁行程（12分钟）
│ ├─ 步行到家（5分钟）
│ └─ 烹饪方案：快速炒鸡蛋+米饭（15分钟）
│ └─ 总时间：42分钟（超时）→ 排除
│
├─ 路径B：打车回家
│ ├─ 叫车等待（5分钟）
│ ├─ 车程（15分钟）
│ ├─ 到家（0分钟）
│ └─ 烹饪方案：三明治（8分钟）
│ └─ 总时间：28分钟（可行）→ 保留
│
└─ 路径C：公交回家
├─ 步行到公交站（5分钟）
├─ 等待公交（5-10分钟）
├─ 公交行程（15分钟）
├─ 步行到家（5分钟）
└─ 烹饪方案：泡面+鸡蛋（5分钟）
└─ 总时间：35-40分钟（可能超时）→ 低优先级

结论：选择路径 B（打车 + 三明治）最可靠，能在 30 分钟内完成任务。

6.3 如何写 prompt 利用思维树

import openai

openai.api_key = "YOUR_API_KEY"

def think_tree(prompt, branches=3, depth=2):
# 1. 生成思维分支
branch_prompt = f"将难题拆分为{branches}个应对方向，简要描述每个方向：\n{prompt}"
resp = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[{"role": "user", "content": branch_prompt}]
)
branches_text = resp.choices[0].message["content"]

# 2. 对每个分支深入探索
results = []
for i, branch in enumerate(branches_text.split("\n")[:branches]):
explore_prompt = f"详细探索方案：{branch}\n"
explore_prompt += f"请提供最多{depth}步的具体实施计划，并评估可行性和总时间。"

resp = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[{"role": "user", "content": explore_prompt}]
)
results.append(resp.choices[0].message["content"])

# 3. 综合评估
evaluate_prompt = f"以下是解决问题的几个方案：\n" + "\n---\n".join(results)
evaluate_prompt += "\n请综合评估，选出最优方案并说明理由。"

resp = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[{"role": "user", "content": evaluate_prompt}]
)

return resp.choices[0].message["content"]

# 使用示例
question = "如何在30分钟内从公司回家，并准备一顿简单晚餐？"
print(think_tree(question))

思维树 prompt 设计技巧

明确分支数量：控制探索的方向数量

设定深度限制：避免单个路径过于冗长

要求评估标准：让模型为每个路径提供可行性评分

使用对比语言：如 "比较"" 权衡 ""最佳选择" 等词汇

可视化输出：要求模型用列表或树状结构展示思考过程

posted on 2025-10-12 14:56 lxjshuju 阅读(365) 评论(0) 收藏举报