2025 年 6月 30 日随笔档案 - 贺艳峰

2025年6月30日

摘要：详细说下RAG流程用户输入问题处理 ● 目标：解析并理解用户查询的意图和关键信息。 ● 关键技术： ○ 查询解析：提取关键词、实体识别（如NER）、语义解析（理解深层意图）。 ○ 查询扩展：通过同义词替换、上下文联想（例如，用户问“Transformer结构”时，补充“注意力机制”相关术语）增强检阅读全文

posted @ 2025-06-30 18:07 贺艳峰阅读(235) 评论(0) 推荐(0)

Post-Pretrain如何进一步注入领域知识

摘要：案例分享度小满轩辕金融大模型基础模型 LLAMA2-70B。使用Post-Pretrain注入金融知识。步骤预训练阶段获得知识万级金融类书籍十万级金融百科词条百万级市公司公告指令微调: 激活问答能力根据金融百科启发式产生对应问答指令数据改写金融试题数据,指令风格统一强化学习阅读全文

posted @ 2025-06-30 01:04 贺艳峰阅读(101) 评论(0) 推荐(0)

LoRA基本原理

摘要： LoRA 原理假设LLM在下游任务上微调得到的增量参数矩阵是低秩的即使存在冗余参数的高维矩阵，但实际有效矩阵是更低纬度的。冻结预训练好的模型权重参数，在冻结原模型参数的情况下，通过往模型中加入额外的网络层并只训练这些新增的网络层参数。 LoRA 计算流程在原始预训练模型参数旁边增加一个旁路阅读全文

posted @ 2025-06-30 00:22 贺艳峰阅读(258) 评论(0) 推荐(0)

heyanfeng

公告