医学研究

2661-359X

华文科学出版社

10.12421/yxyj2661-359X-202517129

20638

基于多模态注意力 Mamba 的医疗影像病变报告生成方法

张善文马亚红* （西京学院电子信息学院西安 710123）

2025 17

疾病早期诊断与详细报告生成对于疾病管理至关重要。针对现有医学报告自动生成方法中存在计算复杂度高、长序列建模能力弱以及视觉与文本模态融合不充分的问题，提出一种基于多模态注意力 Mamba（MAMamba）的医疗影像病变报告生成方法。该模型利用 SSM-Attention 模块并行整合状态空间模型的全局建模能力与自注意力机制的局部特征捕捉优势，并构建多模态融合 Mamba 解码器实现跨模态深度交互，深度融合增强后的视觉特征与文本特征，通过 Transformer 解码器生成准确、连贯的医疗影像病变诊断报告。实验结果表明，该方法在多项自然语言生成评价指标上显著优于现有主流模型，能够生成准确、连贯的临床诊断报告，为医疗影像病变的辅助诊断提供了有效工具。