摘要: 本文提出了一种面向细粒度图像识别的本质可解释深度学习模型——神经原型树(ProtoTree),将原型学习与决策树结构相结合。首先使用卷积神经网络(CNN)将输入图像映射为潜在特征表示;然后通过一个二叉决策树进行层次化推理,其中每个内部节点包含一个可学习的原型,通过计算图像特征与原型之间的相似度来决定路由方向(向左或向右);最终,样本以一定概率到达各个叶子节点,节点的类别分布加权汇总产生预测结果。ProtoTree 的决策过程类似于人类玩游戏时的渐进式问答(如“这只鸟有红喉咙吗?有细长喙吗?那么它是蜂鸟!”),从而实现了全局可解释性(整个树结构可被理解)和局部可解释性(单样本预测路径可追溯)。ProtoTree 在性能上显著优于同类可解释模型,在 CUB-200-2011 和 Stanford Cars 数据集上达到更高准确率的同时,将所需原型数量减少约 90%,并通过剪枝、确定性推理等技术进一步优化了解释效率。 阅读全文
posted @ 2025-11-08 22:45 乌漆WhiteMoon 阅读(12) 评论(0) 推荐(0)