注意力机制和轻量化模型

关于注意力机制,目前的理解还比较局限。结合SLAM相关的端到端文献,注意力机制是能让模型对重要信息重点关注并充分学习吸收的技术,具体表现在其通过Q机制,对SLAM全过程各阶段的信息进行灵活调度使用,在极大程度上避免了信息冗余、节省了内存空间、提高了运行效率;轻量化模型表现在利用知识蒸馏、网络剪枝、模型量化等操作实现模型压缩,同样也以提高信息含金量、利用率为期望。基于笔者的理解,二者在功能上具有部分相似性(虽然这完全是两种东西),那么如何将两者恰如其分的嵌入在优秀项目中发扬光大呢?我想这就是笔者首投的“创新点”了,不得不承认是有些可笑,却又无可奈何的————因为眼下实在寻不见更好的选择,也许某一天慕然回首“却在灯火阑珊处”......

那么当下为之奈何,且为之奈何?AttentionSLAM给出的方案是对图像进行预处理作为输入,将优化BA后的ORBSLAM对其进行建图,结果差强人意,并发表在知名度极高的I锤爆E上(不知道我什么时候也能锤爆E...ORZ),该方案,怎么说呢...可行是必然可行的,但总觉得少点什么,将预处理的图像输入模型需要提前训练的数据集,可若在实践中,没有提前跑好处理好的数据集那不是白给了吗?而且在AD实际应用的话,即时性也不理想。但是转念一想,也许根本不需要考虑这么多,我的模型只是浩瀚星空照耀下的一粒黯然无光石子,也许只对我硕士阶段毕业有点用、对提升我个人能力有点用吧T_T,一想到这我不禁释然了,瞬间对氵论文毫无精神压力了。可话又说回来,总不能氵的太不像话,不能无中生有不能学术不端,做人做事做学问还是要有底线不是嘛?

我还是想要做出点东西的,而且现在是一年级,还有些许时间,再想一想吧,只要思想不滑坡,办法总比困难多。毕业的话,要写一篇完整的端到端识别,既然端到端必然(当下看来必然)要引入Q机制,那就先以Q为核心开展工作。Q机制需要视觉模块给出道路信息并分析判断车辆位置,而视觉模块在VSLAM中几乎提供了全部信息,也就是说,视觉信息是机器的五感......难道要优化输入的权重进行注意力分配,或许可以对特征点建立自注意力机制、分配权值,但是如何输入给系统,让它知晓,看来要深入研究一下O3的代码才行...但这样的改动似乎对程序熟悉度要求要高一些,不如AtteneionSLAM方案更适合一头雾水的我,当然这也许只是当下的想法,但无论如何,代码总是要参透的。虽说万事开头难,可天下大事必作于细,天下难事必作于易,就从易处入手迎难而上吧!

posted @ 2025-03-17 11:42  Pacinonono  阅读(108)  评论(0)    收藏  举报