<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Article Authoring DTD v1.4 20240229//EN" "JATS-articleauthoring1.dtd">
<article article-type="research-article" xml:lang="zh-CN" xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">19</journal-id>
      <journal-title-group>
        <journal-title>医学研究</journal-title>
      </journal-title-group>
      <issn>2661-359X</issn>
      <publisher>
        <publisher-name>华文科学出版社</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.12421/yxyj2661-359X-202517129</article-id>
      <article-id pub-id-type="publisher-id">20638</article-id>
      <title-group>
        <article-title>基于多模态注意力 Mamba 的医疗影像病变报告生成方法</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>张善文 马亚红* （西京学院 电子信息学院 西安 710123）</string-name>
        </contrib>
      </contrib-group>
      <pub-date pub-type="epub">
        <year>2025</year>
        <month>17</month>
      </pub-date>
      <issue>17</issue>
      <abstract>
        <p>疾病早期诊断与详细报告生成对于疾病管理至关重要。针对现有医学报告自动生成方法中存在计算复杂度高、长序列建模能力弱以
及视觉与文本模态融合不充分的问题，提出一种基于多模态注意力 Mamba（MAMamba）的医疗影像病变报告生成方法。该模型利用
SSM-Attention 模块并行整合状态空间模型的全局建模能力与自注意力机制的局部特征捕捉优势，并构建多模态融合 Mamba 解码器实现跨模
态深度交互，深度融合增强后的视觉特征与文本特征，通过 Transformer 解码器生成准确、连贯的医疗影像病变诊断报告。实验结果表明，
该方法在多项自然语言生成评价指标上显著优于现有主流模型，能够生成准确、连贯的临床诊断报告，为医疗影像病变的辅助诊断提供了
有效工具。</p>
      </abstract>
    </article-meta>
  </front>
</article>
