北理工团队在红外弱小集群目标检测领域取得新突破
发布日期:2025-09-11 供稿:光电学院 摄影:光电学院
编辑:盛筠 审核:李家方 阅读次数:近日,北京理工大学光电学院许廷发教授科研团队在红外弱小集群目标检测方面取得新的进展,针对红外成像时序信息利用不足、弱小集群目标信噪比低、背景复杂等核心难题,科研团队提出了一步式Transformer检测方法,研究成果以 “OSFormer: One-Step Transformer for Infrared Video Small Object Detection” 为题,发表于国际计算机视觉与图像处理领域顶级期刊《IEEE Transactions on Image Processing》(TIP,CCF-A 类),TIP是电气与电子工程师协会(IEEE)旗下的图像处理领域顶级学术期刊,被中科院SCI大类分区评为一区TOP期刊,并被中国计算机学会(CCF)推荐为A类期刊。论文第一作者为北京理工大学秦昊林博士研究生,通讯作者为许廷发教授和李佳男长聘副教授。
提出的一步式Transformer检测范式(OSFormer)结构如图1所示。该范式将视频序列转换为立方体格式数据,通过单次推理完成多帧同步分析;设计可变尺寸补丁注意力(Varied-Size Patch Attention,VPA)模块,解决特征细粒度与计算成本的矛盾;集成多普勒自适应滤波器,分离运动目标信号与背景噪声干扰。
图1. OSFormer结构图
通过在不同红外数据集上验证,该方法实现了城市、山地等复杂背景下对低空无人机单目标和集群目标的精准检测,如图2、图3和图4所示。将方法拓展至可见光模态,OSFormer 仍展现出优异的性能。
图2. OSFormer在AntiUAV数据集上的检测效果
图3. OSFormer在InfraredUAV数据集上的检测效果
图4. OSFormer在UAVSwarm数据集上的检测效果
该方法突破了红外弱小集群目标检测技术瓶颈,有效解决了 “时序信息利用、小目标特征捕捉、背景噪声抑制” 三大核心问题,提供了高效精准的技术方案。研究成果对未来
论文详情:Haolin Qin, Tingfa Xu, Yuan Tang, Fengxiang Xu and Jianan Li. 2025. OSFormer: One-Step Transformer for Infrared Video Small Object Detection. IEEE Transactions on Image Processing, doi: 10.1109/TIP.2025.3598426.
论文链接:https://ieeexplore.ieee.org/document/11130659
论文第一作者简介:
秦昊林,2022级北京理工大学博士研究生,师从许廷发教授,主要研究方向为智能目标探测、图像处理技术。在高水平期刊IEEE TIP、IEEE TNNLS、IEEE TGRS及顶会CVPR等发表论文16篇,其中第一作者7篇。入选首届中国科协青年人才托举工程博士生专项计划,获得全国光学与光学工程博士生学术联赛全国百强。
论文通讯作者简介:
李佳男,北京理工大学光电学院,长聘副教授,博士生导师,主要研究方向为光电成像目标多维探测与感知技术研究。连续两年入选全球前2%顶尖科学家(2023、2024年)。以第一或共同第一作者发表论文20篇,包括IEEE TPAMI论文5篇;以通讯作者发表论文60余篇。其中,3篇论文入选ESI高被引,2篇一作论文单篇引用超千次,谷歌学术总引用5600次。主持国家自然科学基金、工信部高质量发展专项(课题)等项目10项。入选中国科协、北京市科协青托。获得地理信息科技进步二等奖(序2),中国图象图形学学会优博,王大珩学生光学奖等。指导学生获得反无人机跟踪挑战赛国际冠军等竞赛奖项10余项。研究成果应用于“中国天眼”、矿产开发遥感监测等领域。
许廷发,博士,教授/博导,国家一级重点学科“光学工程”学科责任教授,光电成像技术与系统教育部重点实验室主任,北京理工大学重庆创新中心副主任。近年来带领其科研团队围绕光电成像探测与识别、计算成像和人工智能等领域不断深化研究。主持承担国家自然科学基金委重大科研仪器研制项目等40余项。在国际、国内等系列期刊发表学术论文200余篇,其中被SCI/EI收录120余篇。以第一发明人申请国家发明专利87项,已授权和公示45项。获省部级科技进步二等奖等奖项3项。指导研究生获得中国图象图形学学会优秀博士学位论文,二人次获得王大珩高校学生光学奖,三人次获得全国光学与光学工程博士生学术联赛全国百强,获得中国高等教育博览会“校企合作 双百计划”典型案例和重庆英才创新创业示范团队等荣誉称号。
分享到: