基于医学图像的人工智能在乳腺癌分子亚型预测中的研究进展
2025-12-22 来源:中国中西医结合影像学杂志

作者:毛宁,卢洁,首都医科大学宣武医院放射与核医学科;杨磊,青岛大学附属烟台毓璜顶医院影像科

 

乳腺癌是女性最常见的恶性肿瘤之一,其发病率和死亡率在世界范围内均呈上升趋势。乳腺癌的分子亚型有Luminal A型、Luminal B型、HER-2过表达型和基底样型/三阴性型(triple negative breast cancer,TNBC),其基因表达模式存在普遍差异,上述亚型在表型表现、治疗反应和生存预后等方面存在明显异质性。

 

因此,早期精准预测乳腺癌分子亚型具有重要意义。目前,乳腺癌分子亚型的划分是基于遗传分析或根据免疫组化中雌激素受体(estrogen receptor,ER)、孕激素受体(progesteronereceptor,PR)、人表皮生长因子受体2(human epidermal growth factor receptor-2,HER-2)和Ki-67 增殖指数等的不同表达水平确定的。上述指标需在组织活检的基础上获得,而活检为有创操作,需麻醉,存在潜在并发症;此外,由于组织样本量有限,上述指标可能会遗漏肿瘤中激素受体的重要信息,因此不能完全代表整个肿瘤的生物学特征。

 

常用的乳腺影像学检查方法有乳腺X线摄影、超声、MRI和对比增强乳腺X 线摄影(contrast enhanced mammography,CEM)等,可提供有关乳腺癌病变形态和功能信息,有助于识别乳腺癌分子亚型。影像组学及深度学习在医疗领域迅速兴起并广泛应用,在乳腺癌分子分型预测方面有重要作用。笔者分析了影像组学及深度学习在不同影像模态下预测乳腺癌分子亚型的研究进展,以帮助医师对乳腺癌患者进行精准治疗。

 

1. 乳腺癌分子亚型概述

 

乳腺癌为一种异质性疾病,自2000年以来,基因表达谱揭示了其多个不同的亚型。在临床实践中常规获取基因表达谱并不可行,因此采用了一种简单的替代分类系统。各分子亚型的免疫组化特征:①Luminal A型为ER(+)和/或PR(+),HER-2(-)且Ki-67(<14%)。②Luminal B型分为2种,HER-2阴性Luminal B型为ER(+)和/或PR(+),HER-2(-),Ki-67(≥14%);HER-2 阳性Luminal B 型为ER 和/或PR(+),HER-2(+)和任何Ki-67表达。③HER-2过表达型为ER(-),PR(-),HER-2(+)。④TNBC型为ER(-),PR(-),HER-2(-)。

 

Luminal A型预后最佳,通常采用内分泌治疗;Luminal B型预后良好,可采用内分泌治疗、细胞毒性化疗或靶向治疗;HER-2过表达型通过靶向治疗联合细胞毒性化疗显著改善了患者预后;TNBC型预后最差,主要采取细胞毒性(新辅助)化疗。因此,准确识别乳腺癌分子亚型对实现及时个体化临床治疗、优化治疗方案及改善预后具有重要意义。目前,临床上主要采用免疫组化分析确定乳腺癌分子亚型,该方法基于组织活检,为有创操作,存在并发症风险,且结果可能有误差。

 

2. 医学图像在乳腺癌诊断中的作用

 

乳腺X线摄影具有直观、操作简单、安全可靠且价格低廉等特点,对微小钙化癌结节有独特优势,但其难以准确评估多中心癌灶的变化趋势,对致密型乳腺的穿透效果不佳,病灶易被掩盖,导致漏诊,在预测乳腺癌分子亚型方面存在一定限制。CEM是一种将乳腺X线摄影和增强成像技术相结合的新兴成像技术,其通过向乳房血管内注射对比剂,将恶性肿瘤新生血管引起的对比增强效应与其解剖结构变化的信息相结合,通过高、低能减影可清晰显示高血流灌注的区域。

 

CEM因其敏感度高、操作简便、检查时间短和费用低廉等优势,在乳腺疾病的诊断中备受青睐。除传统B 型超声外,CDFI 和剪切波弹性成像(shear wave elastography,SWE)已被广泛应用于临床乳腺病变的特征分析中。超声可清晰显示乳房内各层结构,区分囊、实性肿块,实时动态观察病灶的活动性、弹性,并可评估血流状况。近年来,动态对比增强MRI(dynamic contrast enhanced MRI,DCE-MRI)被视为乳腺癌评估最敏感的成像方式,是乳腺癌无创检测、治疗和预后监测的重要方法。DWI等技术可提高诊断特异度。此外,ADC可用于评估人体内水分子扩散运动状态的微观变化,从而间接反映实体肿瘤中的细胞密度。

 

定量DCE 可通过相关参数揭示肿瘤血管生成的细节。乳腺癌DCE-MRI药代动力学分析常用的定量参数包括容量转移常数(volume transfer constant,Ktrans)、速率常数(reverse reflux rate constant,Kep)等。

 

3. 人工智能在医学图像分析中的应用现状

 

目前,人工智能模型在生物医学研究和临床实践中的作用越来越大。影像组学旨在从临床图像中提取可挖掘的高维数据,其研究过程分为具有可定义输入和输出的不同步骤,如图像采集和重建,图像分割,特征提取、分析,及模型构建。目前,影像组学在风险建模和分层、个性化筛查、诊断(包括分子疾病亚型分类)、治疗反应预测和预后评估等应用中均有极大潜力,但其在手工分割病灶方面存在耗时、费力等问题,且由于标注不统一导致数据标准化程度不高。随着深度学习技术在图像分类、检测与分割任务中的水平不断提升,深度学习技术已成为医学影像处理的主导方法。

 

与影像组学不同,深度学习的特征提取并非完全依赖于手工设计的特征,而是自动从图像中获取并筛选更多、更深、更适用研究任务的有关特征,更好地完成相关任务。卷积神经网络(convolutional neural network,CNN)是一类包含卷积计算并具备深度结构的前馈式网络,是目前使用最多的网络。CNN 一般包含输入层、卷积层、池化层、全连接层、输出层。循环神经网络(recurrentneural networks,RNN)是一种具有循环连接的神经网络结构,被广泛应用于时序数据分析任务中。相较于传统神经网络,RNN的主要特点是可处理序列数据,能捕捉到序列中的时序信息。

 

一个典型的RNN网络架构包含一个输入、一个输出和一个神经网络单元。与传统的前馈神经网络不同,RNN的神经网络单元不仅与输入和输出相关,且具有自反馈回路。这种回路允许信息从网络中的一步传递到下一步。长短时记忆网络(long short term memory,LSTM)是一种特殊的RNN,它通过引入门控机制来解决RNN在长序列数据处理中的长期依赖问题。

 

在LSTM中,引入了输入门、遗忘门和输出门3种门控机制,可自适应地决定需要保留和丢弃的信息。LSTM的引入大大提高了RNN在处理长序列数据时的表现和效率。近年来,深度学习技术在乳腺癌诊断和治疗领域获得广泛应用,但深度学习存在计算量大、硬件需求高、模型设计复杂及不可解释性等局限。

 

4. 基于医学图像的人工智能在乳腺癌分子亚型预测中的研究进展

 

4.1 基于影像组学方法

 

近年来,机器学习成为研究乳腺癌分子亚型影像学标志物的新工具。乳腺X线摄影评估的影像学特征,包括一些定性和视觉信息,已被证实与乳腺癌分子亚型相关。Ma等研究发现,头尾位和内外斜位图像相结合的影像组学模型在TNBC vs. 非TNBC、HER-2 过表达型vs. 非HER-2 过表达型、Luminal型 vs. 非Luminal型的分类任务中,与单一拍摄体位影像组学模型相比,其性能更优越。该模型的AUC和准确率分别为0.865(0.796),0.784(0.748),0.752(0.788);这表明不同拍摄体位的乳腺X线摄影图像能提供互补的影像组学特征,从而提高模型的预测性能。

 

Son等研究证明,在区分TNBC与其他分子亚型的任务当中,影像组学和临床信息联合模型的AUC明显优于影像组学模型;这表明临床信息能有效辅助影像组学模型提升预测性能。Zhang等研究发现,基于CEM图像的影像组学模型在识别TNBC乳腺癌方面有较高的预测能力(AUC 0.90,敏感度0.97);这一研究表明CEM影像组学模型在预测乳腺癌分子亚型任务当中具有潜在的应用价值;但该模型的效能仍需多中心、大样本数据集进行改进和验证。

 

叶钉利等研究证明,基于DCE-MRI的影像组学模型对乳腺癌分子亚型有较好的预测能力,强化最明显期相可清晰显示病灶,并能更好地反映肿瘤的异质性。Leithner等建立影像组学预测模型,对Luminal A型和Luminal B型、Luminal B型和TNBC、HER-2过表达型和非HER-2过表达型的鉴别准确率分别为0.842、0.839和0.890。研究表明,瘤周水肿和血管生成与肿瘤的恶性行为相关。

 

Zhang等将DCE-MRI 和影像组学相融合,联合瘤内及瘤周区域提取的特征建立影像组学模型,对术前乳腺癌分子亚型进行预测;结果证实从6 mm瘤周区域提取的影像组学特征在预测Luminal 型vs. 非Luminal型、TNBC vs.非TNBC 的分类任务中表现出最佳性能(AUC=0.794,0.906);从8 mm 瘤周区域提取的特征在预测HER-2过表达型vs.非HER-2过表达型的任务中性能最佳(AUC=0.784);这表明瘤周微环境信息也可提高乳腺癌分子亚型预测模型的性能;该研究还验证了结合瘤周及瘤内特征的影像组学模型相较单一区域特征来源的影像组学模型展示出更高的性能。

 

Zhou等提取了乳腺肿瘤DCE-MRI的4个定量药代动力学参数图,根据不同参数图的影像组学特征建立模型,其预测ER/PR、Her-2和Ki-67的AUC分别为0.71~0.77、0.61~0.68和0.67~0.74;较好地证明了DCE-MRI定量参数在预测乳腺癌分子亚型方面的潜在价值。目前,DCE-MRI联合DWI的多模态MRI分析已成为乳腺癌分子分型领域备受关注的研究方向。

 

Leithner等联合DCE-MRI和ADC建立影像组学模型,结果显示该影像组学模型对乳腺癌分子亚型的预测能力优于单个序列的影像组学模型,表明不同模态之间可实现特征互补,这对于目标任务预测具有重要意义。Niu等利用乳腺X线摄影联合MRI建立影像组学模型来预测乳腺癌分子亚型,与MRI相比,乳腺X线摄影在预测Luminal A型和Luminal B型时表现出更好的性能,AUC 较高(Luminal A 型:0.906 和0.853;Luminal B 型:0.807 和0.784),而预测HER-2过表达型和TNBC 的AUC 较低(HER-2 过表达型:0.974 和0.907;TNBC:0.938 和0.874);该研究表明,不同的影像学检查方法适用于不同的乳腺癌分子亚型分类任务。

 

4.2 基于深度学习方法

 

目前,使用超声预测乳腺癌分子亚型的研究主要集中在深度学习领域。在一项多中心研究中,Jiang等采用了来自1 275例原发性乳腺癌患者的4 828幅超声图像的数据集作为训练样本,构建深度卷积神经网络(deep convolutional neural network,DCNN)模型预测乳腺癌的4种分子亚型;在2个外部测试集中,该模型表现出良好的预测性能,在识别4种乳腺癌分子亚型方面的准确率分别为80.07%~97.02% 和87.94%~98.83%;该研究表明,基于超声图像的DCNN模型可显著提高对乳腺癌分子亚型的预测性能,有可能提供一种无创、节省成本的方法,在初始治疗前评估肿瘤生物学行为。

 

在一项多中心研究中,Zhou等前瞻性地评估807例乳腺癌患者的B型超声、CDFI和SWE图像的数据集;他们设计了一个由3 种CNN 网络(DenseNet 121、ResNet 50 和SENet 50)组合而成的对齐式卷积神经网络(ACNN)模型结构,以预测乳腺癌的分子亚型;在训练队列中构建了基于B型超声图像的单模态ACNN模型、基于B 型超声和CDFI 图像的双模态ACNN 模型及基于B型超声、CDFI和SWE图像的多模态ACNN模型;多模态ACNN模型(宏观平均AUC为0.89~0.96)在预测乳腺癌4种分子亚型(Luminal A型、Luminal B型、HER-2 过表达型、TNBC)方面优于双模态ACNN 模型(宏观平均AUC为0.81~0.84)和单模态ACNN模型(宏观平均AUC 为0.73~0.75)。

 

此外,多模态ACNN 模型在预测Luminal A 型、HER-2 阳性Luminal B型、HER-2阴性Luminal B型、HER-2过表达型、TNBC 5种分子亚型(AUC:0.87~0.94 vs. 0.78~0.81 vs. 0.71~0.78)和识别TNBC 乳腺癌(AUC:0.934~0.970 vs. 0.688~0.830 vs. 0.536~0.650,P<0.05)方面均优于单模态和双模态ACNN模型;这表明不同模态的超声图像包含了有关乳腺癌的不同信息,使用多模态超声数据不仅可提高神经网络性能,还有助于更好地从各个模态中提取特征,实现特征互补,促进更大规模的预测。

 

Sun等设计了一个基于集成学习的预测模型,利用乳腺DCE-MRI图像来区分2种乳腺癌亚型(Luminal型vs.非Luminal型),模型表现出色,在测试集中的AUC 达0.867;该研究证实基于CNN 的深度学习模型在乳腺癌分子分型任务中的应用前景广阔。

 

在一项多中心研究中,Zhang等分别利用CNN 和卷积长短时记忆(convolutional long short term memory,CLSTM)网络构建深度学习模型预测乳腺癌分子亚型;CLSTM在训练过程中可获得比传统CNN更高的准确率(0.91 vs. 0.79),表明CLSTM循环网络可跟踪DCE采集过程中信号强度的变化,充分探索增强前后不同期相包含的时间特征,更适用于乳腺癌分子分型任务;但由于数据量太少,无法充分训练神经网络参数,因此,在独立测试集中,所开发的模型不能直接应用,经迁移学习重新调整后,模型的准确率得到了显著提高。

 

乳腺X 线摄影和超声是乳腺癌筛查的常规方法,通常用于识别和表征乳腺病变和指导活检。与乳腺MRI不同,这2种方法在癌症诊断方面具有广泛性和适用性。Zhang等收集3 360例乳腺癌患者的乳腺X线摄影和相对应的超声影像数据,开发了具有模态内和模态间注意模块的多模态深度学习模型(MDL-ⅡA),来提取乳腺X线摄影和超声之间的重要信息;与其他队列模型相比,MDL-ⅡA 在预测4类分子亚型方面的诊断性能最佳,马修斯相关系数为0.837;这表明多模态成像比单一模态成像在乳腺癌分子分型任务中更具优势,在多模态深度学习模型中,模态内和跨模态注意机制进一步提升了其性能。这一观点支持了多模态医学成像可能为预测乳腺癌的分子亚型提供相关的影像生物标志物的观点,从而有望为乳腺癌患者的治疗提供指导。

 

5. 小结与展望

 

通过总结近年来国内外的研究发现,随着影像组学和深度学习技术的不断进步,以及在医学领域中的应用越来越广泛,人工智能技术在术前通过医学图像预测乳腺癌分子亚型的任务中具有较大发展潜力和极大的临床应用价值。随着算法、算力、网络架构的创新与突破,数据库的不断完善,数据质量的提高,以及标注工具的不断成熟,乳腺癌分子分型的研究由以前集中在影像组学领域慢慢向深度学习进行转变,研究也从以前的单一中心、单一模态逐步发展为多个中心、多种模态。不同的影像学检查技术及各种机器学习方法相结合,有利于推动精准医疗的发展。

 

然而,该领域仍存在一定局限性:

 

①大多数研究中使用的注释数据是基于免疫组化的替代品,而非正式的遗传分析,这可能会导致偏差。未来乳腺癌分子亚型的鉴定需基于遗传分析,并评估人工智能模型与正式遗传分析之间的分子亚型分类的一致性。

 

②Luminal B HER-2阴性与Luminal B HER-2阳性肿瘤具有不同的影像学特征和治疗策略。然而,由于Luminal B HER-2 阳性患者较少见,常与Luminal B HER-2 阴性合并为Luminal B 型进行分析。未来须建立一个基于更大样本量的改进模型,以分别预测这2种类型。

 

③大部分研究纳入的HER-2过表达型和TNBC型乳腺癌样本相对较少;未来研究应招募更多此亚型患者,以更好地训练和利用人工智能模型。尽管人工智能在临床应用中还有一定局限,但其相较于传统诊断方法,具有更高的预测效能,可协助放射科医师更精确的诊断,指导临床决策,具有广阔的发展前景。影像组学和深度学习有望在乳腺影像诊断和临床治疗上取得更大的突破。

 

来源:毛宁,杨磊,卢洁.基于医学图像的人工智能在乳腺癌分子亚型预测中的研究进展[J].中国中西医结合影像学杂志,2025,23(01):112-117.


(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)

0
收藏 分享