复杂场景多目标跟踪新突破!RGTrack 算法:精度、速度、轻量化三管齐下
点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID计算机视觉研究院学习群扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC12431453/pdf/sensors-25-05325.pdfColumn of Computer Vision Institute本文提出的全新RGTrack模型用重参数化卷积 全局注意力 多级关联策略实现跟踪精度、推理速度、模型轻量化全面提升特别适合嵌入式与资源受限设备。PART/1背景当前主流多目标跟踪分为两类两阶段SDE检测 重识别分开做精度高但速度慢难实时。单阶段JDE检测与特征提取一体化速度快但在密集遮挡场景下ID 不稳定、跟踪精度不足。代表性 JDE 模型 CSTrack 虽缓解了任务竞争问题但面对复杂环境仍有明显短板特征提取对关键区域聚焦不足多尺度特征融合能力有限帧间目标关联策略不够稳健身份切换ID Switch现象依然严重PART/2创新RGTrack 以 YOLOv5 为基础框架围绕特征更强、关联更稳、速度更快做了三大关键创新。1. 全局上下文 GC 注意力精准抓关键在主干网络加入GC Block兼顾 Non-local 的全局建模能力与 SE 的高效计算让网络自动忽略冗余信息聚焦目标主体。作用显著提升密集、遮挡下的检测与特征判别力。2. 重参数化 RepConv训练多分支、推理单路在 Neck 特征融合层替换为RepVGG 卷积训练用多分支结构提升特征表达推理融合为单路 3×3 卷积不增加推理耗时作用增强特征融合同时保持高速推理。3. 多级关联策略稳住 ID 不漂移基于卡尔曼滤波设计四级匹配流程结合外观特征 GIOU 位置信息高分检测→跟踪轨迹匹配高分检测→未匹配跟踪轨迹匹配低分检测→跟踪状态轨迹匹配高分检测→未确定轨迹匹配作用大幅降低 ID 切换提升跟踪连续性。【RGTrack 整体网络结构】PART/3效果效果精度↑速度↑体积↓全面领先团队在 MOT16/17 权威数据集上验证对比基线 CSTrackRGTrack 实现全方位提升核心指标提升MOTA跟踪精度1.15%IDF1身份匹配1.73%MT完整跟踪率6.86%ID Switch身份切换-47.49%速度与轻量化FPS推理速度51.48%模型体积-3.08%【MOT16 测试集不同方法对比结果】可视化对比在密集人群场景中CSTrack 频繁漏检、错检ID 易混乱RGTrack 完整检出目标身份稳定不漂移【CSTrack 与 RGTrack 检测效果对比】【CSTrack 与 RGTrack 跟踪效果对比】PART/4总结与展望RGTrack 证明单阶段 JDE 框架可以在复杂场景下做到 “高精度 高实时 轻量化”。它通过全局注意力强化特征、重参数化兼顾性能与速度、多级关联稳定身份完美适配智能监控、自动驾驶、机器人等落地场景。未来团队将进一步探索多模态数据融合RGB 深度 激光雷达长时间遮挡后的重识别更极致的轻量化与端侧部署在真实复杂视觉场景中RGTrack 为多目标跟踪提供了一套实用、高效、可落地的新方案。有相关需求的你可以联系我们END转载请联系本公众号获得授权计算机视觉研究院学习群等你加入ABOUT计算机视觉研究院计算机视觉研究院主要涉及深度学习领域主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架提供论文一键下载并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程让大家真正体会摆脱理论的真实场景培养爱动手编程爱动脑思考的习惯往期推荐YOLO-TLA一种基于 YOLOv5 的高效轻量级小目标检测模型ViT-YOLO基于Transformer的用于目标检测的YOLO算法SSMA-YOLO一种轻量级的 YOLO 模型具备增强的特征提取与融合能力适用于无人机航拍的船舶图像检测LUD-YOLO一种用于无人机的新型轻量级目标检测网络Gold-YOLO基于聚合与分配机制的高效目标检测器Drone-YOLO一种有效的无人机图像目标检测「无人机AI」“空中城管”无人机AI光伏巡检自动化解决方案无人机视角下多类别船舶检测及数量统计机场项目解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题2PCNet昼夜无监督域自适应目标检测附原代码YOLO-S小目标检测的轻量级、精确的类YOLO网络大改Yolo框架 | 能源消耗极低的目标检测新框架附论文下载改进的检测算法用于高分辨率光学遥感图像目标检测