8.22课设报告
昨天夜里就收到了学长的回复,他们当时参考的是一个叫做KCF的滤波器算法,里面运用到的主要模型是高斯混合模型(GMM)。这个模型虽然只需要一点高等代数和概率论的基础知识,但其解决的核心问题依然是对于视频中目标的搜寻与定位,无法根本解决在多目标识别与追踪课题中不同时间帧目标匹配的问题,于是我们有查阅了大量的相关资料,了解到了目前在多目标领域较火的Sort和它的改进算法Deep Sort,其中后者加入了对于多目标遮挡造成的误差修正。经过这几天的阅读与查找,我们发现大部分的目标识别算法都基于一个叫做卡尔曼滤波的模型,其旨在解决对一个有多个不稳定参数的系统未来的状态进行预测,而其基于的核心思想是:对于一个目标当前的状态(加上正太分布修正之后)与这个目标在下一个时间节点所观测到的状态(加上正太分布修正之后)进行加权整合,来预测这个目标在下一个时间节点的具体位置,其中的权重取决于两个正态分布的方差。由于最后得到的实际位置为两个正太分布的乘积,其方差必然减小,于是我们便利用两个较为模糊的位置范围得出了一个精确的范围。在利用卡尔曼滤波预测出每个目标的范围之后,我们便可以利用昨天博客中所提到的对于二分图的匈牙利算法来得到下一时间帧目标与检测目标最可能的匹配结果。
然而即使看了这么多,当务之急是明天的报告,通过对与前几天浏览内容的总结,我们最终还是选择了Tracktor作为我们这个项目参考的算法,它是目前MOT领域名列前茅的几个算法之一,也是极少数的开源算法之一。然而参考开源的算法似乎并没有我之前想像的那么简单,该项目Github页面下虽然有详细的安装说明,但由于这个项目是基于Python端口的,其间涉及了大量虚拟环境和储存库的安装与调用。在匆匆忙忙把python下载下来后甚至连第一行克隆储存库的代码都不知道该往哪里输。好在距离第二周开始上传代码还有一个周末的功夫,于是我在今天对于我们小组成员的分工和周末的安排进行了明确的规划。
我们小组的另外两名成员张翊晖和陈智源,负责研读论文和算法,其中由张翊晖负责明天的汇报,陈智源负责辅助理解和疑难解答。在明天上午,我们打算先去研讨室由他们先为我讲解该项目的用户需求与算法流程,我则负责找出问题,来保证下午的报告能够正常进行。而我在周末的工作则是学习Pyhon的基本用法,尽可能在两天内在我的电脑上完成相关编译环境的安装,并对该项目进行试运行。
长路漫漫啊~

浙公网安备 33010602011771号