混合采样下多级特征聚合的视频目标检测算法

QIN Siyi,GAI Shaoyan, DA Feipeng

Journal of Zhejiang University (Engineering Science)（2024）

引用 0|浏览1

暂无评分

摘要

针对现有基于深度学习的视频目标检测算法无法同时满足精度和效率要求的问题，在单阶段检测器YOLOX-S的基础上，提出基于混合加权采样和多级特征聚合注意力的视频目标检测算法. 混合加权参考帧采样(MWRS)策略采用加权随机采样操作和局部连续采样操作，充分利用有效的全局信息与帧间局部信息. 多级特征聚合注意力模块(MFAA)基于自注意力机制，对YOLOX-S提取的分类特征进行细化，使得网络从不同层次的特征中学到更加丰富的特征信息. 实验结果表明，所提算法在ImageNet VID数据集上的检测精度均值AP50达到77.8%，平均检测速度为11.5 ms/帧，在检测图片上的目标分类和定位效果明显优于YOLOX-S，表明所提算法达到了较高的精度，具有较快的检测速度.

查看译文

关键词

machine vision,video object detection,feature aggregation,attention mechanism,YOLOX

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要