LangChain中的Message

在LangChain框架中，SystemMessage、HumanMessage、AIMessage和ChatMessage是用于构建对话流程的核心消息类。它们的区别主要体现在角色定位、功能用途以及对大语言模型（LLM）行为的影响上。以下是详细解析：

一、各类消息的定义与核心作用

1. SystemMessage（系统消息）

定义：SystemMessage是对话中的初始化指令，用于设置LLM的行为模式、上下文或背景信息。通常作为对话的首条消息传入。
核心功能：
- 角色设定：例如“你是一个机器学习专家”。
- 行为约束：限制LLM的响应范围，如“禁止回答AI相关问题”。
- 风格控制：定义回答的语气（正式/幽默）或格式（JSON/列表）。
参数特性：
- content：必填的指令内容（字符串）。
- additional_kwargs：存储工具调用等附加数据。
- response_metadata：包含响应头、token计数等元信息。
对LLM的作用：直接影响模型对后续对话的理解方向，确保输出符合预设规则。

2. HumanMessage（用户消息）

定义：表示用户向LLM发送的输入，对应对话中的“用户”角色。
核心功能：
- 传递用户请求：如提问“帮我翻译这段文本”。
- 支持多模态输入：可包含文本、图像、音频等混合内容。
参数特性：
- content：支持字符串或字典列表（多模态）。
- name：可选用户标识，用于区分不同用户。
对LLM的作用：作为模型生成响应的直接依据，决定对话的具体内容。

3. AIMessage（AI消息）

定义：表示LLM生成的响应，可能包含文本或工具调用请求。
核心功能：
- 返回结果：如回答用户问题或执行函数调用。
- 携带元数据：包含工具调用参数、错误日志等信息。
参数特性：
- tool_calls：记录模型请求调用的工具及参数。
- usage_metadata：记录token消耗等资源使用情况。
对LLM的作用：在多轮对话中，历史AIMessage可作为上下文，影响后续响应。

4. ChatMessage（通用消息）

定义：一种灵活的消息类型，允许自定义role字段（如“admin”），但需注意模型兼容性。
核心功能：
- 非标准角色支持：适用于特定场景（如自定义角色“审核员”）。
局限性：部分模型可能不支持自定义角色，需优先使用前三类。

二、四类消息的核心区别

类别	角色	发送方	典型位置	内容特性	模型依赖
SystemMessage	`system`	开发者/系统	对话首位	行为指令、上下文	部分模型需通过API参数传递
HumanMessage	`user`	用户	对话中间	用户输入（可多模态）	所有模型支持
AIMessage	`assistant`	LLM	对话中间或末尾	模型响应（含工具调用）	所有模型支持
ChatMessage	自定义（如`admin`）	任意方	灵活	任意内容，需手动指定`role`	部分模型不支持

三、对LLM的作用机制

SystemMessage的全局控制：
- 通过首条消息设定LLM的“人格”，例如让模型以专家身份回答，避免无效发散。
- 实验表明，合理使用SystemMessage可提升响应准确性30%以上。
HumanMessage的输入驱动：
- 用户输入的质量直接影响模型输出。例如，多模态输入（如图像分析）需依赖特定模型支持（如Gemini Vision）。
AIMessage的上下文延续：
- 在多轮对话中，历史AIMessage会被LLM作为参考。例如，模型调用工具后返回的结果需通过ToolMessage反馈给LLM。
ChatMessage的灵活性与风险：
- 自定义角色可能破坏模型对标准角色的理解，需谨慎使用。例如，定义role="validator"可能导致模型忽略指令。

四、典型使用场景示例

场景1：受限对话

from langchain_core.messages import SystemMessage, HumanMessage
from langchain_openai import ChatOpenAI

model = ChatOpenAI()
messages = [
    SystemMessage(content="你是一个只会回答烹饪问题的助手，其他问题一律拒绝。"),
    HumanMessage(content="量子力学的基本原理是什么？")
]
response = model.invoke(messages)  # 输出："我仅回答烹饪相关问题。"

作用：通过SystemMessage限制模型响应范围。

场景2：多模态处理

message = HumanMessage(
    content=[
        {"type": "text", "text": "描述这张图片"},
        {"type": "image_url", "image_url": "https://example.com/cat.jpg"}
    ]
)
response = model.invoke([message])  # 输出图片描述文本

作用：利用HumanMessage传递混合内容。

场景3：工具调用

# AIMessage返回工具调用请求
ai_msg = AIMessage(
    content="",
    tool_calls=[{"name": "get_weather", "args": {"location": "北京"}}]
)
# 后续通过ToolMessage返回工具执行结果
tool_msg = ToolMessage(content="北京天气晴，25℃", tool_call_id="call_123")

作用：实现LLM与外部工具的交互。

五、最佳实践与注意事项

SystemMessage优化：
- 简洁性：避免过长指令（建议<200 tokens），以免挤占上下文窗口。
- 优先级：部分模型（如GPT-4）对首条SystemMessage更敏感。
HumanMessage设计：
- 结构化输入：使用content列表分隔复杂问题，提升模型解析效率。
- 安全性：过滤用户输入中的敏感信息，防止提示注入攻击。
AIMessage处理：
- 工具调用验证：检查tool_calls的合法性，避免执行恶意代码。
- 元数据分析：通过usage_metadata监控资源消耗，优化成本。
ChatMessage慎用：
- 仅在标准角色无法满足需求时使用，并确保目标模型支持自定义角色。

六、总结

在LangChain框架中，四类消息通过角色分工实现对LLM的精细化控制：

SystemMessage是“导演”，设定对话规则；
HumanMessage是“用户代理”，传递具体需求；
AIMessage是“执行者”，生成响应或触发工具；
ChatMessage是“灵活扩展”，但需谨慎使用。

理解它们的差异与协作机制，是构建高效、可靠LLM应用的关键。

posted @ 2025-03-24 08:47 economies 阅读(943) 评论(0) 收藏举报

刷新页面返回顶部

economies