摘要: chain_extract.pycontextual_compression.py在 LangChain 中,多轮对话的上下文压缩主要用于解决长对话场景下的 Token 超限问题,通过对历史对话内容进行总结、提取关键信息或截断,在保留核心上下文的同时减少 Token 消耗。以下从核心方案、具体实现代 阅读全文
posted @ 2025-10-30 10:18 BlogMemory 阅读(78) 评论(0) 推荐(0)