基于MRI人工智能预测乳腺癌分子分型的研究进展_MRI_人工智能_乳腺癌_影像科

基于MRI人工智能预测乳腺癌分子分型的研究进展

发布时间：2026-02-04 | 来源：国际医学放射学杂志

关键词： MRI 人工智能乳腺癌影像科

作者：汪群，侯唯姝，李小虎，余永强，安徽医科大学第一附属医院影像科

根据中国癌症中心报告显示，2022 年我国乳腺癌新发病例为35.72 万，是中国女性发病率第二的恶性肿瘤，严重威胁女性的身心健康。乳腺癌是一种高度异质性肿瘤，具有多种分期、分级和分子亚型分型标准。

Perou 等在2000 年首次提出基于基因测序进行分子分型的概念，将乳腺癌分成腔面上皮(Luminal)型、人类表皮生长因子受体2(human epidemal growth factor receptor 2， HER-2)过表达型、基底细胞样型和正常乳腺样型。

随后，Sorlie 等依据雌激素受体α 的表达情况，进一步将Luminal 型乳腺癌细分为Luminal A 型和Luminal B 型。目前常用的是2013 年St.Gallen 等基于免疫组化标志物和增殖标记蛋白Ki-67 的分子分型:Luminal A 型、Luminal B 型(HER-2 阳性型和HER-2 阴性型)、HER-2 过表达型、三阴性型乳腺癌(triple negative breast cancer，TNBC)以及其他特殊类型。

不同分子分型的乳腺癌具有不同的疾病进展和转归模式，其治疗方案、治疗反应、预后及生存率各不相同。另外，乳腺癌的耐药、复发和转移也是大多数病人治疗失败的主要原因。因此，术前无创预测分子亚型对乳腺癌病人的个性化精准治疗具有重要价值。MRI 作为一种无创性成像技术，可以有效地弥补乳腺组织穿刺活检的单点取材且有创损的局限性，是预测乳腺癌分子分型的重要影像学工具。

基于形态学的多模态MRI 评估乳腺癌分子亚型的研究已相对成熟，但乳腺癌的高度异质性和观察者肉眼识别影像的局限性，不可避免地限制了传统方法对该领域的深入研究。

影像组学能提取MRI 影像中乳腺癌组织纹理、形状和强度等高通量、深层次特征并使用特定算法进行训练与学习，有利于分析组学特征与雌激素受体、孕激素受体、HER-2 等分子标志物表达水平的关系，为MRI 预测乳腺癌分子亚型提供了新的思路。随着计算机算力和医学影像数据库标准化的飞速发展，基于MRI 影像组学预测乳腺癌分子亚型的研究已经大量涌现，但研究方法缺乏统一标准，单中心研究、模态多样、算法多样、样本的复杂性等因素也导致了相关研究结果的多样化。因此，本文对基于多模态MRI 的影像组学算法和研究结果予以综述，为未来相关研究提供理论支持和文献依据。

1. MRI 影像组学预测乳腺癌分子亚型的模态基础

1.1 动态增强MRI (DCE-MRI)

DCE-MRI 不仅能同时提供乳腺癌的形态学、血流灌注和瘤周组织信息，而且与其他模态相比具有更高的空间分辨率和观察者间一致性，是基于MRI 的影像基因组学中应用最多、诊断效能最高的模态。

DCE-MRI 影像的影像组学特征与乳腺癌多种分子生物标志物表达水平相关，Leithner 等提取143 例乳腺癌DCEMRI影像中的直方图特征、纹理特征和高阶特征，通过k-最近邻分类(留一交叉验证)算法判断影像组学和分子亚型的关系，发现影像组学对Luminal型、HER-2 过表达型和TNBC 的预测效能均高于80%。

Zhang 等的双中心研究进一步使用循环神经网络(recurrent neural networks，RNN)和卷积神经网络(convolutional neural networks，CNN)的深度学习算法探讨乳腺癌分子分型，结果显示使用迁移学习的RNN 可以示踪DCE 采集过程中信号强度的变化，其分类准确度比CNN 提高30%以上。

1.2 扩散加权成像(DWI)

DWI 能够反映肿瘤的细微结构和空间异质性，是预测乳腺癌分子分型的重要模态之一。一项关于DWI 信号异质性与分子分型相关性研究的Meta 分析表明，不同分子亚型乳腺癌的表观扩散系数(ADC)值各不相同，ADC 定量参数能够区分乳腺癌的分子亚型。影像组学与DWI 结合在乳腺癌分子分型的预测中展现出更大的潜能，Zhang 等分别提取483 例乳腺癌DCE-MRI和非单指数DWI 影像中的高通量特征并使用多种机器学习模型进行对比研究，结果显示两者的诊断效能相当[DCE-MRI，受试者操作特征曲线下面积(AUC)=0.62~0.87；DWI，AUC=0.62~0.91]。

1.3 T1WI 和T2WI

常规T1WI 上显示的乳腺癌与正常腺体组织对比度差异小，无法提供丰富的影像组学特征，因此其较少用于乳腺MRI 影像组学中。而T2WI 影像与肿瘤的一阶特征和纹理特征密切相关，因此成为MRI 影像组学研究的重要序列之一。Liu等对158 例乳腺癌病人多模态影像学的深度学习研究显示，基于T2WI 的影像组学诊断Luminal A 型乳腺癌的AUC 达0.700(95%CI:0.545~0.827)，高于乳腺钼靶、DWI 和ADC 图，但仍低于上述模态的联合诊断效能0.802 (95%CI:0.657~ 0.906)。

由此可见，T2WI 在乳腺MRI 影像组学研究中具有重要性，基于多模态联合的MRI 影像组学能够提供更多的高通量特征，是未来研究的主要方向之一。由于乳腺癌存在空间异质性，当前的研究已不局限于肿瘤内部的影像学特征，而是扩展到不同范围的瘤周组织，“瘤内和瘤周”研究模式已取得初步成果。

周晶等在340 例乳腺MRI 影像上勾画病灶并对分割后感兴趣区(ROI)环形膨胀4 mm，结果显示，基于单序列的影像组学标签中，DWI 预测HER-2 的效能最高；基于多序列的影像组学标签中，DCE 瘤内+T2WI 瘤内+DWI 瘤内+DCE 瘤周+T2WI 瘤周+DWI 瘤周的AUC 可达0.913，表明联合瘤内和瘤周影像组学特征能为肿瘤分型的研究提供更多维度的信息。

2. 影像组学在乳腺癌分子分型中的研究

2.1 影像组学特征与乳腺癌分子亚型的关系

影像组学能够挖掘MRI 各模态影像中肿瘤内部的高通量深度特征并进行量化，通过探讨组学特征与不同分子标志物的关系来预测乳腺癌分子亚型。Mazurowski 等[20]提取了48 例乳腺癌病人注射对比剂前后T1WI 影像的23 个形态学、纹理和动态增强特征并联合分子亚型进行回归分析，发现肿瘤的强化特征及背景实质强化(background parenchymal enhancement，BPE) 与Luminal B 型乳腺癌存在关联，虽然研究样本量和提取特征数目都相对较少，但这是首次应用影像组学探讨MRI 与乳腺癌分子亚型相关性的研究。

影像组学特征可以反映分子亚型的肿瘤内异质性，Lafci 等进一步探讨了基于DCE -MRI 提取的影像组学特征与Luminal A、Luminal B 型乳腺癌的关系，结果表明影像组学特征能够反映不同分子亚型肿瘤的异质性，是无创性表征Luminal 亚型乳腺癌的重要工具。

2.2 影像组学结合机器学习预测分子分型

作为影像组学的关键部分，机器学习是概率决策的运作方式，有助于提高分析过程的高效性，确保研究结果的客观性和准确性。应用于乳腺癌的机器学习算法包括回归、分类、聚类3 种，多因素Logistic 和最小绝对收缩和选择算子(least absolute shrinkage selector operator， LASSO)回归等用于预测连续型变量；随机森林(random forest， RF)、支持向量机(support vector machine， SVM)等分类器用于预测离散型变量；聚类属于无监督学习，常见的为k 均值聚类(k-means clustering， KM)。

2.2.1 回归模型

Logistic 回归是乳腺癌影像组学研究中应用最广泛的二分类线性回归模型，具有计算效率高、可解释性强、应用范围广的优势，但对于多类别问题需要进行扩展。Ramtohul 等提取乳腺癌T2WI 联合DCE-MRI 影像的影像组学标签，构建的多因素Logistic 回归模型在外部测试数据集中区分HER-2 低表达、HER-2 过表达与HER-2 阴性肿瘤的AUC 为0.80，这是首次应用影像组学区分HER-2 表达状态。

LASSO 扩展逻辑回归算法能从大型数据集中选出对于预测目标最重要的变量，较Logistic 回归更加适用于预测因素较多且彼此关联的情况。LASSO 算法可高效筛选出最简洁有利的预测因素，也可用于基于LASSO 回归系数生成影像组学标签、构建多因素预测模型。

Xu 等基于DCEMRI影像提取788 个影像组学特征，利用LASSO 回归算法筛选出8 个最佳影像组学特征并结合临床危险因素建立3 种预测模型(临床模型、影像组学模型和组合模型)，结果发现组合模型在区分乳腺癌分子亚型方面具有最佳效能，敏感度、特异度和AUC 值分别为0.832、0.781 和0.830，但该研究仅基于单模态MRI 进行，难以提供更全面的组学信息。综上，回归模型在预测乳腺癌分子亚型方面具有良好的诊断效能；然而，当模型中的特征数量较大时，回归模型会产生过拟合且诊断效能降低，限制了其在临床的应用。

2.2.2 分类器模型

RF 和SVM 是深度学习应用最广泛的分类算法。RF 是多个模型构成的集成学习算法，其准确度显著高于单模型。张丁懿等基于RF 建立3 个预测模型(DWI 模型、DCE 模型和联合模型)，对Luminal 型和非Luminal 型乳腺癌进行二分类研究，结果显示3 种模型训练组的预测效能均良好(AUC>0.8)，测试组的预测效能虽稍下降，但仍保持在较理想的范围内(AUC>0.7)。

SVM 是通过最大化两类数据的间隔从而达到最好分类效果的算法，具有对样本量依赖性小、过拟合概率低的优势。Wang 等从84 例乳腺浸润性癌DCE-MRI 影像中提取了85 个成像特征，降维后建立的SVM 预测模型识别TNBC 的AUC 值、分类准确度分别为0.782、86.9%。但该研究是一项样本量相对较少的回顾性研究，研究结果缺乏普适性，需行更大规模的前瞻性验证研究。

2.2.3 聚类模型

KM 是最常用的聚类模型，K 代表样本类别数，通过分析数据在空间中的分布状况进行分类，称为聚类。KM 模型可解释性强、操作简单，但是准确度低于监督模型，对K 值选择也很敏感。Wang 等提取浸润性乳腺癌DCE-MRI 影像中的影像组学特征，使用KM 分类器模型预测TNBC 具有较高的效能；进一步的研究显示，增加BPE 为预测因素后，预测TNBC 的AUC 由0.782 提高至0.878，准确度也由86.9%增至90%。

多种模型联合应用于预测乳腺癌分子分型具有更高的预测效能，Feng 等联合SVM 和Logistic 回归构建了基于影像组学评分和临床因素的列线图预测模型，该列线图对Luminal 型和非Luminal 型乳腺癌具有良好的分类效能；Guo 等联合Logistic 回归和KM 分别构建了传统影像组学模型和基于深度语义分割特征的影像组学模型以评估HER-2 表达状态，然后通过平均2 个模型的输出概率构建新的深度学习影像组学模型，研究表明该模型能够有效区分HER-2 阴性和HER-2 阳性组(AUC=0.763)，以及HER-2 低表达和HER-2 零表达组(AUC=0.75)。

Zhang 等和Huang 等均使用多种算法构建预测模型，结果发现多参数MRI 在TNBC 和非TNBC 之间、HER-2 阳性和HER-2 阴性之间、HER-2 阳性/HER-2 阴性和其他亚型之间均具有较高的鉴别诊断效能。综上，基于单一算法和联合算法的机器学习模型在乳腺癌分子分型预测的研究中已表现出较高的诊断效能，但上述研究大多存在入组病例差异较大、算法选择主观性强以及相关结果临床可解释性不高的局限性。因此，根据临床需求选用科学合理的机器学习方法是研究的重点。

3. 深度学习预测乳腺癌分子分型

深度学习的核心是通过神经网络学习并模拟人脑神经元之间的连接和信息传递过程，应用于乳腺癌研究的深度学习方法主要有人工神经网络(artificial neural network，ANN)、CNN 和RNN。ANN 是大多数深度学习网络的基础，Leithner等基于91 例乳腺癌病人的DCE-MRI 和ADC 图影像，利用多层感知器前馈ANN (multi -layer perceptron feed-forward ANN，MLP-ANN) 对TNBC与其他亚型乳腺癌进行区分，结果显示MLP-ANN对TNBC 和Luminal A 型具有较高的区分效能(AUC=0.8)。

尽管MLP 网络是公认的强大机器学习算法，但更先进的深度学习技术，如包含大量隐藏层和神经元之间互连的CNN 表现更好。CNN 是包含卷积计算的深度结构的ANN，其算法的核心是将原始图像通过卷积核进行卷积计算得到特征图，通过池化层降维选取主要特征。2019 年，Zhu 等首先利用基于CNN 的3 种深度学习方法对270 例乳腺癌病人的DCE-MRI 影像进行Luminal A 型和其他亚型的分类，尽管效能不佳(AUC 值仅为0.65)，但该研究显示了迁移学习的优势，为分子分型的进一步研究提供了新的方向。

Yin等利用ResNet-18 对乳腺癌多参数MRI 进行术前评估，研究发现基于DCE 序列的模型表现最好，且该模型对TNBC 和HER-2 的过表达型乳腺癌的鉴别效能优于Luminal A 和Luminal B 型。然而，这些先进算法在相对较小的样本群体中使用时，其复杂性会增加过度拟合的可能性并降低泛化性。

RNN 是一类具有内部环状连接的ANN，使信息在网络循环，相较于CNN 具有层数简单、可有效存储和处理序列信息的优势。但其对长序列的记忆能力较弱，无法避免时间轴上出现“梯度消失”或“梯度爆炸”问题。Zhang 等应用传统的CNN 和能够追踪DCE-MRI 中时间信息的卷积长短期记忆(CLSTM)递归网络构建了分子分型预测模型，将乳腺癌分为HER-2 阳性/HER-2 阴性、HER-2 阳性和TNBC3 个亚型，在训练集中使用CLSTM 评估的平均准确度高于CNN(分别为0.91 和0.79)。但该研究中所有分子亚型乳腺癌的样本量均较小，尚需大样本量研究的进一步验证。

基于多参数MRI 的深度学习在无创预测乳腺癌MRI 分子分型中具有较高的效能，为乳腺癌病人的计算机辅助诊断和个性化治疗提供了更多的依据。然而，上述大多数研究均基于二元分类模型进行，仅能关注单一的亚型分类指标，是深度学习在乳腺癌分子分型研究中的主要局限性之一。此外，与诊断乳腺癌的效能相比，深度学习模型预测乳腺癌分子分型的效能并非十分理想，这可能与较小的数据集和大部分为回顾性研究有关。

4. 多组学联合预测乳腺癌分子分型

缺乏临床可解释性是影像组学的局限性之一，因此当前越来越关注于影像组学与基因组学、病理组学、免疫组学等结合的多组学研究，以期从微观组织角度解释影像组学结果。Mazurowski 等探讨了来自2 个医学中心48 例乳腺癌病人的DCEMRI影像特征(形态学、纹理和血流动力学特征)与基因组学特征的关系，发现肿瘤强化率与BPE 强化率较高的病变更可能是Luminal B 型乳腺癌。

Park等基于乳腺影像报告和数据系统(BI-RADS)、MRI纹理特征及全核糖核酸(RNA)测序数据建立了影像基因组学模型，前瞻性分析不同分子亚型乳腺癌的MRI 特征与基因表型间的关系，并发现雌激素受体和HER-2 表达状态的亚组中影像表型与基因表型间存在关联。上述研究虽然规模小，却初步证实了影像基因组学应用于乳腺癌分子分型预测的可行性。

Jiang 等联合860 例早期乳腺癌病人DCEMRI影像组学、转录组学和代谢组学数据的研究显示，多组学研究既可准确区分TNBC 与其他亚型(AUC=0.920)，又可区分TNBC 的分子亚型(AUC=0.819)；进一步的研究还发现，反映肿瘤异质性的MRI 特征Peri_V_DN 与肿瘤免疫抑制显著相关，因此该特征可作为评估TNBC 的预后指标。综上，多组学联合研究不仅能够获得比单组学更高的分子分型预测效能，而且能够揭示肿瘤宏观影像组学特征与微观基因表型、免疫机制的内在联系，显著提高了影像组学研究结果的可解释性，是影像组学的重要研究方向。

5. 不足与展望

虽然基于MRI 的影像组学能够深入挖掘影像特征，表征乳腺癌的异质性，但入组样本的构成差异、多研究中心扫描方案的差异、图像分割及算法选择的主观性过强仍是限制模型泛化性和临床应用的重要因素。因此，构建具备标准化图像采集和标注的高质量影像组学数据库将是乳腺影像组学的重点发展方向。

此外，应联合多学科开展乳腺影像组学研究，综合基因组学、蛋白组学、免疫组学等多组学共同揭示影像组学的可解释性。随着人工智能技术的飞速发展和多学科交叉融合的大势所趋，影像组学无创预测乳腺癌分子分型的研究终将立足于临床，减少乳腺癌病人非必要的有创性检查，为病人临床治疗方案的选择提供更多依据。

来源：汪群，侯唯姝，李小虎，等.基于MRI人工智能预测乳腺癌分子分型的研究进展[J].国际医学放射学杂志，2025，48(01):96-101.DOI:10.19300/j.2025.Z21524.

(本网站所有内容，凡注明来源为"医脉通"，版权均归医脉通所有，未经授权，任何媒体、网站或个人不得转载，否则将追究法律责任，授权转载时须注明"来源：医脉通"。本网注明来源为其他媒体的内容为转载，转载仅作观点分享，版权归原作者所有，如有侵犯版权，请及时联系我们。)