12月15日至18日,在武汉举行的IEEE International Conference on Bioinformatics and Biomedicine(BIBM 2025,CCF B类)上,课题组最新研究成果MedMamba-YOLO: A Vision State Space Model for Medical Image Detection被会议正式录用。
随着医学影像技术的快速发展,基于CT、MRI及显微图像的医学目标检测在计算机辅助诊断(CAD)系统中发挥着越来越重要的作用,在肿瘤定位、病灶分析和细胞检测等临床应用中具有广泛前景。然而,医学图像普遍存在目标尺寸小、边界模糊、对比度低以及数据规模有限等问题,使得传统目标检测方法在精细空间建模和多尺度感知方面面临显著挑战。针对上述问题,我们提出了一种新型医学图像目标检测框架 MedMamba-YOLO。该框架引入状态空间模型(SSM)进行视觉建模,充分利用其线性计算复杂度和长程依赖建模优势。首先,构建了多尺度融合特征金字塔网络(MSF-FPN),并在其中嵌入提出的空间感知视觉状态空间模块(SAVSSB),将空间注意力机制与二维状态空间建模相结合,实现了跨尺度特征的高效融合与上下文信息建模。其次,设计了跨路径交互模块(CPIB),通过双路径特征协作与残差增强机制,加强不同特征分支之间的信息交互,提高了复杂医学场景下的特征表达能力。此外,在检测头部分提出了异构多尺度膨胀注意力检测头(HMDADetect),通过多分支可变膨胀率注意力机制,自适应建模不同尺度目标的空间特征,有效提升了小目标检测精度和边界回归性能。在Br35H脑肿瘤数据集和BCCD血细胞检测数据集上的大量实验结果表明,MedMamba-YOLO 在检测精度和计算效率方面均表现出明显优势。该模型在仅3.8M参数量和8.8 GFLOPs的条件下,分别取得了95.4%、91.9%的MAP50,显著优于 YOLOv8-N、YOLOv10-S 以及多种主流检测方法,并且无需预训练即可获得稳定且领先的检测性能。实验结果验证了所提出方法在复杂医学图像场景中的高精度与鲁棒性。

MedMamba-YOLO网络结构

MedMamba-YOLO与YOLOv8-N、Mamba YOLO-T检测效果对比
论文第一作者为2023级硕士生郭建勇,通讯作者为武相军教授。
IEEE International Conference on Bioinformatics and Biomedicine(BIBM)作为中国计算机学会(CCF)推荐的B类学术会议,已成为生物信息学和生物医学领域首屈一指的研究会议。自2007年以来,IEEE BIBM已在美洲、欧洲和亚洲等多个国家成功举办了18届活动。IEEE BIBM 2025是BIBM系列会议的第19届学术盛会。它为传播生物信息学和健康信息学领域的最新研究成果提供了一个领先的论坛,汇聚了来自计算机科学、生物学、化学、医学、数学和统计学等领域的学术界及工业界科学家。