FairMOT,一种快速跟踪视频中多个对象的系统

微软和华中大学研究人员 已经发展 一种使用机器学习技术跟踪视频中多个对象的新型高性能方法——FairMOT(公平多对象跟踪)。 基于 Pytorch 和训练模型的方法实现代码 发表 在 GitHub 上。

大多数现有的对象跟踪方法使用两个阶段,每个阶段由单独的神经网络实现。 第一阶段运行一个模型来确定感兴趣对象的位置,第二阶段使用关联搜索模型来重新识别对象并将锚点附加到它们上。

FairMOT 使用基于可变形卷积神经网络的单阶段实现(DCNv2,可变形卷积网络),它可以让您实现对象跟踪速度的显着提高。 FairMOT 在没有锚点的情况下工作,使用重新识别机制来确定高精度对象地图上对象中心的偏移量。 同时,执行处理器来评估可用于预测其身份的对象的各个特征,并且主模块执行这些特征的收敛以操纵不同尺度的对象。

FairMOT,一种快速跟踪视频中多个对象的系统

为了在 FairMOT 中训练模型,结合使用了用于人员检测和搜索的六个公共数据集(ETH、CityPerson、CalTech、MOT17、CUHK-SYSU)。 使用视频测试集测试模型 2DMOT15, 莫特16, 莫特17 и 莫特20项目提供的 MOT 挑战 并涵盖不同的情况、摄像机的移动或旋转、不同的视角。 测试表明
费尔莫特 领先 最快的竞争模型 TrackRCNN и JDE 在每秒 30 帧的视频流上进行测试时,表现出足以动态分析常规视频流的性能。

来源: opennet.ru

添加评论