人工智能MRI在乳腺癌诊断与疗效预测中的研究进展
发布时间:2026-07-01   |   来源:磁共振成像
关键词: 乳腺癌 磁共振成像 影像科

作者:孙绍梅,王若兰,毕承柳,李勤勍,杨军,云南省肿瘤医院(昆明医科大学第三附属医院)放射科

 

乳腺癌是女性最常见的恶性肿瘤之一,其发病率逐年上升且呈现年轻化趋势。乳腺MRI对乳腺癌的诊断具有较高的敏感性,在乳腺癌诊疗决策中发挥着关键作用。近年来,乳腺MRI 应用越来越广,将乳腺MRI 与人工智能(artificial intelligence, AI)相结合不但能提高诊断准确率,还能优化诊疗决策。AI主要包括两个领域,即机器学习(machine learning, ML)和深度学习(deep learning, DL)。ML 是AI 的一个重要分支,通过从现有的临床训练数据集中学习,开发出功能强大的模型。

 

DL 是ML 的一种特殊形式,以神经网络作为其主要架构。DL 方法可以直接对MRI图像进行分析,无需手工制作的特征集。其中,卷积神经网络(convolutional neural network, CNN)是目前DL 中最成功的网络类型,其隐藏层具有特殊的连接结构,更利于图像特征的识别和学习。目前,基于AI 的乳腺MRI 研究正在积极开展,在此过程中取得了许多成就,例如基于MRI 的AI 技术可提高乳腺良恶性病变鉴别的准确率;无创地进行分子亚型、腋窝淋巴结(axillary lymph nodes, ALN)状态预测;客观地进行乳腺背景实质强化(background parenchymal enhancement, BPE)定量评估;对患者的疗效和预后进行有效预测等。

 

同时AI 与乳腺MRI 技术相结合,用以缩短扫描时间和提升图像质量。但其发展也面临着诸多挑战,主要集中在数据依赖性、模型可解释性、多模态融合等方面。本综述旨在总结AI 在乳腺癌MRI 诊断与疗效预测中的最新研究进展,梳理研究现状,探讨现阶段的短板和突破点,为后续研究提供参考。

 

1. AI 在乳腺癌诊断中的应用

 

1.1 乳腺良恶性病变鉴别

 

MRI 具有较高的软组织分辨率,可采用多序列成像,对乳腺癌检测的敏感度高达80%以上,对乳腺癌诊断的价值较大。为了比较影像组学分析(radiomics analysis, RA)和CNN对多参数乳腺MRI良恶性病变的鉴别性能,TRUHN等使用L1 正则化和主成分分析进行RA,同时采用具有34 层深度残差神经网络构建CNN模型,对病变进行良恶性分类,并用受试者工作特征曲线下面积(area under the curve, AUC)评估其性能。结果表明,CNN 性能(AUC 为0.88)优于RA的L1 正则化(AUC 为0.81)和RA 的主成分分析(AUC 为0.78)。

 

在多参数乳腺MRI 中,CNN的诊断性能优于RA。在半样本队列与全样本队列训练后观察到L1 正则化AUC分别为0.80 和0.81,主成分分析AUC分别为0.78 和0.78,差异无统计学意义,CNN的AUC 从0.83 提高到0.88,纳入更多的训练数据可进一步提高CNN的性能。ZHOU等对基于不同感兴趣区(region of interest, ROI)的影像组学及DL 方法在鉴别良恶性病变时的准确度进行比较,纳入133 例患者的MRI 图像用于训练模型。

 

基于ResNet50 构建的DL 模型的准确度达91%,其中仅包含近端瘤周组织的最小边界框构建的模型具有更高的准确性。WITOWSKI 等基于MRI 图像采用增强前、后的乳腺体积构建DL 模型,来预测13 463 例可疑患者患乳腺癌的概率,并且尽可能减少临床解释的假阳性。该模型在测试集中AUC 值为0.92,在验证集中AUC 值为0.80~0.97。

 

此外,DL 模型的诊断准确率与5 名乳腺放射科医生相当。在乳腺良恶性病变鉴别方面,DL 较影像组学更具优势,特别是CNN的发展为乳腺良恶性病变鉴别提供了新的途径,CNN有潜力通过更多的训练数据集进一步改进并提升其性能。但是,由于病变特征的复杂性,良恶性病变的MRI 表现可能存在重叠,一些小病灶和早期病变容易被忽略或误判为良性。目前需结合多参数MRI 数据,开发高敏感度的AI 模型,利用AI 技术捕捉病变内部的异质性特征,以提高模型对良恶性病变的鉴别能力。

 

1.2 乳腺癌分子分型

 

在临床实践中,根据患者的雌激素受体(estrogen receptor, ER)、孕激素受体(progesterone receptor, PR)和人表皮生长因子受体2(human epidermal growth factor receptor 2, HER-2)的表达情况将乳腺癌分为luminal A、luminal B、HER-2 阳性和三阴性四种分子亚型。与肿瘤活检相比,影像检查可以无创地获得肿瘤特征。

 

2019 年,HA 等建立基于MRI 特征的CNN预测模型,用于区分乳腺癌分子亚型。研究纳入216 例患者进行评估,结果表明预测的准确率为70%,AUC 为0.853。一项研究为了评估多参数MRI 对分子亚型的预测性能,收集了13 个多参数特征,并选择关键特征来开发ML 模型,最终多参数模型表现出良好的预测效能。

 

由于常规的免疫组化(immunohistochemistry,IHC)分型标准与St Gallen 标准有所不同,乳腺癌被分为不同的分子亚型,对于不同分子亚型的患者临床治疗策略和预后也有所不同。为了明确不同的参考标准是否会影响基于MRI 的AI 模型进行luminal 分型的性能,JI 等开展了一项研究,纳入2015 至2017 年期间的乳腺癌患者并对其luminal 分型进行了分组:(1)两种参考标准分类均为luminal A的肿瘤(一致型);(2)IHC 分类为luminal A 和StGallen 分类为luminal B的肿瘤(不一致型);(3)两种参考标准分类均为luminal B的肿瘤(一致型)。

 

再基于MRI 图像提取了28 个影像组学特征对luminal A或luminal B 肿瘤分类,确定一致型和不一致型肿瘤之间影像组学特征的差异。结果表明一致型和不一致型肿瘤的6 个影像组学特征不同(P≤0.001),一致型肿瘤与不一致型肿瘤之间的差异具有统计学意义。该研究表明参考标准的差异会影响基于MRI 的AI 模型对luminal 分子亚型的评估。目前基于MRI 图像特征无创地预测乳腺癌分子亚型的研究取得一定进展,但在精准医疗时代,直接使用影像特征预测或明确分子亚型仍是一项挑战。通过多模态影像数据和更高阶算法的融合,模型的预测效能会进一步提升。

 

1.3 乳腺BPE 定量评估

 

BPE 是乳腺MRI 增强扫描时乳腺纤维腺体组织(fibroglandular tissue, FGT)的强化程度。依据乳腺影像报告数据系统(breast imaging reporting and data system, BI-RADS)对BPE 进行定性评估容易受评估者的主观影响,而定量评估能给出更客观的结果,因此BPE 的定量评估成为当前主要的研究方向之一。NOWAKOWSKA等开发了量化BPE 的模型,首先使用单一机构的数据进行U-Net 模型训练,再采用多中心的数据对该模型进行验证。所开发的模型被用来量化了MRI 中的FGT 和BPE 的量,并分析这些定量评估结果和放射科医生定性所分类别之间的相关性。最终得出评估BPE 时,还需考虑体素的强度和形态等因素。

 

另一项研究开发了一种全自动CNN模型,在标准2D U-Net 结构的基础上改进并生成了一种新的3D CNN,采用一系列尺寸为3×3×3 的3D卷积滤波器用于CNN的分层特征提取,在测试集中用于量化BPE的CNN模型准确度为82.9%。一些研究提出BPE 与乳腺癌的诊断和预后相关,可用于乳腺癌相关风险的评估。

 

WATT 等研究全自动量化BPE 的程度与乳腺癌风险的相关性。该研究纳入536 例乳腺癌病例和940 例无癌症对照,使用全自动软件定量量化乳腺体积、FGT 体积和BPE体积。再对定量BPE程度与乳腺放射科医生定性评估的BI-RADS BPE类别之间的相关性进行比较。结果表明定量BPE 程度与BI-RADS BPE 呈正相关,与低BPE相比,高BPE与乳腺癌风险增加的相关性更高,比值比(odds ratio, OR)为1.74。

 

BPE 虽然有助于乳腺癌的诊断和预后的评估,但目前定量BPE 评估标准并不统一。为了明确不同的定量BPE评估方法与放射科医生定性评估结果之间的相关性,MÜLLER-FRANZES 等纳入3207 名患者的5773 次乳腺MRI。BPE 先经过放射科医生的定性评估,再采用四种不同的定量方法(两种基于强化程度,两种基于强化腺体组织体积)提取BPE,并与医生定性评估结果比较相关性和一致性。结果表明不同的定量BPE评估方法与医生视觉定性评估的一致性不高,四种方法测定的BPE之间有显著的相关性差异。未来的研究需基于多种不同的自动量化方法,结合放射科医生的评级结果,探索更符合临床诊断需求的BPE定量评估方法。

 

1.4 腋窝淋巴结状态预测

 

ALN 状态是乳腺癌重要的预后指标,也是后续治疗决策制定的主要参考因素。ALN清扫和前哨淋巴结(sentinel lymph node, SLN)活检是临床最常用于评估ALN 状态的方法,但两种手术都具有侵入性。基于乳腺MRI 的AI 模型可以无创且有效地评估淋巴结的状态及其转移风险,对患者的后续治疗具有一定指导意义。一项研究使用随机森林(random forest, RF)算法选取MRI 中关键的影像特征,再结合支持向量机算法,开发出预测ALN状态的模型。结果表明该影像组学模型表现出高预测效能,训练集和验证集的AUC均接近0.9。

 

WANG等纳入485 例乳腺癌患者,在MRI 和乳腺X线图像上提取肿瘤和淋巴结区域的影像组学特征,并使用保留的特征构建RF 模型。再将相关的临床资料与影像组学模型相结合,构建多模态模型。该多模态模型显示出优异性能,训练集AUC 为0.964,内部验证集AUC 为0.916,外部验证集AUC 为0.892。所有验证集都超过了放射科医生在MRI 和腋窝超声上对ALN的诊断。结合相关的临床及病理资料,共同构建多组学、多模态模型,可进一步提升模型性能,更好地进行ALN状态的预测。对于已有SLN转移,但非前哨淋巴结(non-sentinel lymph node, NSLN)转移风险较低的乳腺癌患者,行ALN清扫会导致过度治疗。

 

2023 年,CHEN 等开发出一种基于MRI 的CNN 模型,用于预测乳腺癌SLN和NSLN的转移风险,CNN模型表现出较好的预测性能。采用术前MRI图像预测ALN状态,可减少不必要的侵入性腋窝手术和过度治疗,同时也可协助外科医生对乳腺癌患者进行个性化腋窝治理。但由于现有的AI模型对小淋巴结特征提取能力有限,导致模型对小淋巴结和淋巴结的微小转移难以检测和评估,模型的敏感度仍不高。未来的研究需结合多参数MRI 数据中的形态学和功能学特征,以提高模型预测效能。

 

2. AI 在乳腺癌疗效预测中的应用

 

新辅助化疗(neoadjuvant chemotherapy, NAC)是早期高危和局部晚期乳腺癌患者的常规治疗选择。接受NAC 后实现病理完全缓解(pathologic complete response, pCR)的患者,肿瘤分期明显降级,可接受更保守的治疗方式,或许能免于手术干预。因此开发基于MRI 的AI 模型,有助于无创地预测患者对NAC 的应答情况,并采取相应的治疗措施。2020 年SUTTON等的研究纳入NAC 后的273 名乳腺癌患者的MRI 和手术病理报告,对MRI 图像进行影像组学分析,并使用递归特征消除算法构建两个模型,即仅包含影像组学特征的模型1 和结合影像组学特征与分子亚型的模型2。

 

模型1 训练集和测试集的AUC 分别为0.72 和0.83;模型2 则分别为0.80 和0.78。结合影像组学与分子亚型的模型,能更准确地预测pCR情况。2023 年,DAMMU等的研究采用新型CNN,结合MRI、人口学信息和分子分型,预测乳腺癌患者NAC后的pCR、残余肿瘤负荷(residual cancerburden, RCB)和无复发生存期(recurrence-free survival,PFS)。结果显示,最佳模型预测的pCR 准确率为81%,RCB 准确率为80%,PFS 平均为24.6±0.7 个月(生存期为6.6~127.5 个月)。

 

为了明确乳腺癌和腋窝淋巴结阳性患者NAC后的情况,2024 年,LIN等纳入268 例完成NAC并接受手术的乳腺癌患者,分析其影像组学特征和临床病理特征,选择最佳特征构建ML 模型来预测患者NAC后的情况。结果表明多层感知机算法在预测ALN pCR方面效能最佳,AUC为0.825,准确率为77.1%。该算法在预测乳腺癌pCR方面也优于其他模型,AUC为0.852,准确率为81.3%。

 

MRI 图像特征可作为乳腺癌疗效的预测因子,但是目前很难只基于影像特征建立一个准确的预测模型。需要综合多层面的肿瘤相关信息包括临床病理特征、分子特征等构建多维度的模型进行疗效预测,以便为临床提供更为可靠的诊疗决策。

 

3. AI 在乳腺癌复发预测中的应用

 

乳腺癌的复发与多种因素相关,乳腺癌术后2 年复发率为11.8%,生存率为94.8%

。有研究表明乳腺MRI 可用于预测Oncotype Dx 复发评分,可作为预测乳腺癌复发风险的指标。一项回顾性研究纳入术前乳腺MRI 图像并从中提取纹理和形态的影像组学特征,通过提取的特征识别和验证乳腺癌异质性的内在成像表型预测10 年内复发情况。为了明确接受NAC 患者的早期复发情况,一项研究采用迁移学习方法对治疗前和治疗早期的MRI 图像进行分析,使用预先训练的CNN模型从MRI 图像中自动提取低层次特征,再使用提取的最佳特征构建预测模型,用以预测NAC 后患者的复发情况。

 

此外,ROMEO 等的研究通过回顾性分析公共数据集中的MRI 图像,结合Oncotype Dx 复发评分,筛选出92 个有效特征用于构建预测模型。该模型在测试集中准确度为63%,敏感度为80%,能有效地预测ER+HER-2+乳腺癌患者的复发风险。目前,越来越多的研究表明BPE的强化程度对乳腺癌的复发具有预测价值,BPE可能成为乳腺癌复发的预测指标。

 

AREFAN等纳入127 例乳腺癌患者,将其分为开发集和内部测试集。使用内部开发的AI模型自动量化双侧乳房BPE 的量,分析BPE 与Oncotype DX复发评分之间的关系。模型在开发集中区分高、低风险患者的准确性较高(AUC为0.94),在测试集中也表现良好(AUC为0.79)。基于BPE的AI模型,能够有效预测乳腺癌复发风险,其预测结果类似于Oncotype DX 复发评分系统。目前,在临床实践中推荐使用70 基因检测和21 基因复发评分来预测复发风险。然而,这些检测的成本较高无法普遍适用。基于MRI的AI模型可协助识别复发风险,并促进治疗决策的制订和开展。但是由于复发机制的复杂性,仅依靠MRI图像特征难以获取复发的多维度风险因素。在后续的研究中增加病理和分子分型等相关临床资料,构建多模态、多组学模型,可更好地用于复发风险的预测并提供个性化的风险分层及治疗方案。

 

4. AI 在乳腺MRI 技术中的应用

 

扩散加权成像(diffusion weighted imaging, DWI)广泛用于协助乳腺良恶性病变的诊断,但DWI采集时间较长且空间分辨率低。近年来,基于DL的重建算法展现出巨大的潜力,一些研究使用基于DL的重建算法显著降低了乳腺DWI的采集时间,同时提高了图像的空间分辨率。此外,JING等使用最大密度投影(maximal intensity projection, MIP)图像训练DL 模型,用该模型识别扫描正常和扫描异常的超快速乳腺MRI 图像。在测试集中,模型的AUC为0.81,同时该模型减少了15.7% 的工作量和16.6% 扫描时间。

 

KAPSNER 等运用DL 模型来识别乳腺MIP 上的伪影,在测试集中,检测到伪影的精确率-召回率AUC为0.921,阳性预测值为0.981。LIEBERT等仅将增强前T1WI 作为输入源,使用DenseNet 模型来预测增强后MIP 图像上的伪影。在测试集中,该模型可以预测增强后约三分之一的伪影(敏感度为31%,AUC为0.66)。AI 与乳腺MRI 技术相结合的研究目前主要集中于图像分辨率、DWI 采集时间以及伪影校正,并取得一定进展。未来的研究需聚焦于快速成像技术、无对比剂成像等方面,促进AI与MRI技术的深度融合。

 

5. 小结与展望

 

基于乳腺MRI 的AI 算法和模型的研究虽然取得一定的进展,但在研究和实际应用过程中也面临着诸多的困难和挑战。首先,AI模型的性能依赖于训练数据集的数量和质量,如果没有足够的数据样本或者数据质量不高,AI模型性能可能会出现偏差。来自不同机构或不同设备的数据导致的数据格式不统一也会使模型训练难度增加。

 

其次,多数模型是由单中心的单个数据集进行训练和验证的,数据缺乏多样性,无法准确应用于不同的人群和临床环境。DL模型通常被称为“黑盒”模型,模型输出的结果难以解释。模型的可解释性不足会导致模型可信度低,使得模型应用工作难以推进。模型还可能存在过拟合现象,表现为在训练数据集中运行良好但在测试集中运行结果较差。

 

针对上述问题,可通过数据增强、迁移学习方法改善数据依赖性,同时标准化预处理数据,确保数据格式的统一;通过开展多中心研究,利用共享数据平台获取多样化数据来解决单一数据问题;采用可解释、可视化AI技术,结合临床经验来构建模型,增加模型的可信度。

 

综上所述,尽管目前还面临一定的问题,但基于乳腺MRI 的AI 算法和模型的研究正在蓬勃展开,其对诊断准确性的提高、诊疗效率的提升以及诊疗方案的优化都有着积极的意义。研究人员也在不断地探索新的技术和方法去突破和克服现存的问题和挑战,推动AI 在乳腺MRI 中的应用进一步开展。目前,这些研究已经逐渐向着多中心、多模态、多层次方向发展。相信未来AI 在乳腺癌的诊疗方面会发挥越来越重要的作用,发展的前景也会越来越广阔。

 

来源:孙绍梅,王若兰,毕承柳,等.人工智能MRI在乳腺癌诊断与疗效预测中的研究进展[J].磁共振成像,2025,16(02):193-197+228.


(本网站所有内容,凡注明来源为"医脉通",版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明"来源:医脉通"。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)
0
收藏
添加表情
全部评论
我要投稿
发表评论
扫码分享

微信扫码分享

回到顶部