任务:评估微调后的模型性能,进行优化。
进展:使用测试集评估模型,发现其在解方程和不等式任务上表现良好,但在高次方程求解上表现不佳。
问题:高次方程求解能力不足。
解决方案:增加高次方程相关数据,重新微调模型。