问答以及提示词工程微调

问答以及提示词工程微调

问答相关的主逻辑流程:

 

 

微调逻辑:

 

 

 

数据集构建:

 

数据来源

数据量

标注方式

诗词网(Selenium爬取)

8万条

标注标准答案+儿童简化版本

科普中国(API调用)

6万条

添加比喻句/拟声词标记

儿童问答社区(过滤清洗)

12万条

标注语法错误及修正方案

 

 

LoRA配置:

 

 

rank=8       # 低秩矩阵维度

alpha=32     # 缩放因子

target_modules=["q_proj","v_proj"]  # 仅微调10%参数

dropout=0.05 # 防止过拟合

 

3. 微调创新点

 

领域适配增强:
五大领域独立微调,避免知识混淆(如历史事件严格按时间线回答)

 

 

 

情感分析模型简介:百度PaddleHub-ERNIE微调中文情感分析(文本分类)_paddle-ernie-CSDN博客

硬性规则如同高速过滤网,精准拦截70% 的典型领域文本,剩余复杂案例交由ERNIE分类器深度处理。这种规则先行+模型兜底的架构,使系统在乡村低算力设备上实现95%+ 的领域分类准确率,响应时间压缩至50ms以内。

 

 

微调策略差异化

领域

微调重点

童趣化手段

诗词

作者生平+情感分析

添加儿歌韵律(如“李白喝酒作诗,咕咚咕咚真开心!”)

历史

时间线准确性

历史人物拟人化(如“秦始皇爷爷统一中国”)

科技

原理简化+生活类比

加入拟声词(“砰!气球爆炸是因为空气挤爆啦”)

生活

语法容错↑+多轮对话连贯性

模仿儿童口语(“你要吃苹果吗?甜甜的哟~”)

哲学

引导开放式思考

追加反问(“你觉得小鸟自由吗?”)

 

 

安全合规内嵌:
植入教育敏感词过滤层,拦截暴力/恐怖类输出(拦截率99.6%

 

认知匹配机制:
根据交互历史动态调整答案深度:

 

posted @ 2025-06-26 11:22  艾鑫4646  阅读(15)  评论(0)    收藏  举报