近日,学院李天平课题组在人工智能领域TOP期刊《Expert Systems with Applications》上发表题为“Semantic and spatial feature reinforcement for object detection”的研究论文。山东师范大学为第一署名单位,研究生张振亦为第一作者,李天平教授为通讯作者。

本研究中,针对现有目标检测方法在特征提取环节因语义与空间特征增强不足、检测子任务间特征校准与交互不畅,难以适配现代高性能检测需求的问题,提出一种单阶段高效语义与空间特征增强检测器,命名为SSFRDet,整体模型架构如图所示。具体而言,设计了基于Transformer的语义与空间提取编码模块SSEFormer,聚焦多尺度特征协同提取,在不同特征尺度下高效捕获高层语义上下文信息与低层空间细节边界特征,实现两类核心特征的深度交互,同时强化模型多尺度局部与非局部特征提取能力,完成目标长程像素级依赖关系的精准建模,且该模块性能全面优于原始Transformer架构,突破了传统编码器的特征提取局限;在此基础上,进一步开发任务交互对齐解码模块TIA-Head,专攻检测子任务间的特征协同问题,通过对解耦后的分类与回归两类任务特征开展自适应特征权重交互,生成标准化共享偏移量,有效优化任务预测对之间的匹配一致性,打通子任务间的信息传递通道,实现任务专属特征的高效对齐与深度交互。本研究在多尺度语义空间特征协同提取、Transformer编码器优化、检测子任务交互对齐等技术方向的创新尝试,不仅针对性解决了单阶段目标检测的核心技术瓶颈,还可为小目标检测、旋转目标检测、多模态目标定位等相关视觉任务提供可行的技术参考,以高效视觉特征提取与任务协同机制的优化,助力计算机视觉领域高精度、轻量化检测技术的迭代升级与实际场景落地。

以上研究获得国家自然科学基金面上项目、山东师范大学科研创新团队等资助。论文链接:https://doi.org/10.1016/j.eswa.2026.132117