1.对AuxFormer加多尺度又试了几个方案,但是跑出来效果还是不好。 2.看苏老师之前推ICCV2023的论文《Tracking Everything Everywhere All at Once》,训练完可视化的结果如下: 论文比较难,还没完全看懂