问答以及提示词工程微调
问答以及提示词工程微调
问答相关的主逻辑流程:

微调逻辑:

数据集构建:
|
数据来源 |
数据量 |
标注方式 |
|
诗词网(Selenium爬取) |
8万条 |
标注标准答案+儿童简化版本 |
|
科普中国(API调用) |
6万条 |
添加比喻句/拟声词标记 |
|
儿童问答社区(过滤清洗) |
12万条 |
标注语法错误及修正方案 |
LoRA配置:
rank=8 # 低秩矩阵维度
alpha=32 # 缩放因子
target_modules=["q_proj","v_proj"] # 仅微调10%参数
dropout=0.05 # 防止过拟合
3. 微调创新点
领域适配增强:
五大领域独立微调,避免知识混淆(如历史事件严格按时间线回答)

情感分析模型简介:百度PaddleHub-ERNIE微调中文情感分析(文本分类)_paddle-ernie-CSDN博客
硬性规则如同高速过滤网,精准拦截70% 的典型领域文本,剩余复杂案例交由ERNIE分类器深度处理。这种“规则先行+模型兜底”的架构,使系统在乡村低算力设备上实现95%+ 的领域分类准确率,响应时间压缩至50ms以内。

微调策略差异化
|
领域 |
微调重点 |
童趣化手段 |
|
诗词 |
作者生平+情感分析 |
添加儿歌韵律(如“李白喝酒作诗,咕咚咕咚真开心!”) |
|
历史 |
时间线准确性↑ |
历史人物拟人化(如“秦始皇爷爷统一中国”) |
|
科技 |
原理简化+生活类比 |
加入拟声词(“砰!气球爆炸是因为空气挤爆啦”) |
|
生活 |
语法容错↑+多轮对话连贯性 |
模仿儿童口语(“你要吃苹果吗?甜甜的哟~”) |
|
哲学 |
引导开放式思考 |
追加反问(“你觉得小鸟自由吗?”) |
安全合规内嵌:
植入教育敏感词过滤层,拦截暴力/恐怖类输出(拦截率99.6%)
认知匹配机制:
根据交互历史动态调整答案深度:

浙公网安备 33010602011771号