作者:孔雅晴,
目前各类影像学检查技术在肝转移诊断、疗效评估及预后预测方面存在一定局限,因此亟需一种个性化精准分析方法,为CRLM诊疗的临床决策提供更多辅助信息, 以优化患者的预后。随着计算机科学的发展,近年来深度学习影像组学(deep learning radiomics,DLR)在CRLM的研究中已取得了一定的成果, 本文拟对DLR在CRLM诊疗中的应用予以综述,并展望其未来发展前景。
1. DLR简述
影像组学这一分析方法由学者Lambin等于2012年首次提出, 该方法的主要步骤包括获取高质量影像图像、确定兴趣区(region of interest,ROI)、提取并筛选既定的高通量特征、构建影像组学模型及后续验证,可用于指导肿瘤的诊断、预后预测以及疗效评估等。然而,在临床实际应用中,传统影像组学方法仍面临诸多挑战。
首先,ROI分割耗时费力,且需要操作人员具备丰富的影像学诊断经验,极大地制约了其在临床上大规模推广应用。
其次,传统影像组学特征在鲁棒性和结果预测的准确性方面仍有较大的提升空间。深度学习是一大类算法的统称,其隶属于机器学习的分支,是人工智能应用于医学图像处理的主要技术,可直接使用源图像开展训练。
深度学习通过神经网络算法自动获取并学习影像图像中更深层次的特征,有助于提高分类识别性能。相较于传统影像组学,具有高效、稳定性强及重复性好的优势。但深度学习模型训练需要大量数据,在数据有限的情况下, 易出现过拟合或欠拟合的问题。鉴于此,为弥补二者的不足,研究人员采用深度学习特征代替或补充传统影像组学特征,并与经典分类器结合, 提出了DLR方法。
目前,DLR方法中最常用到的算法是卷积神经网络(convolutional neural network,CNN)、稀疏自编码器等。DLR有望在不增加样本量的前提下,提高传统影像组学流程的自动化程度, 更全面深入且有针对性地挖掘图像信息,从而提升预测结果的准确性和可靠性,具有极大的潜在临床应用价值。在肝脏肿瘤领域,DLR的应用价值呈现出多元且关键的特性。目前,DLR在
2. DLR在CRLM诊断中的应用
研究表明,发生肝转移的结直肠癌患者,其5年生存率显著低于未发生转移者。因此,早期诊断及预测肝转移的发生有助于为患者提供有效治疗,改善其预后。根据诊断原发灶和肝转移发生的时间,CRLM分为同时性与异时性肝转移。目前同时性肝转移的诊断主要依赖各类影像检查技术,但这些技术各有其相对优势与不足。超声及
增强MRI是目前检出肝转移瘤最敏感的影像学手段,但对于少部分肉眼难以辨别的转移灶, 仍难以精准探查。而对于异时性肝转移,传统影像学检查技术更难以对其进行有效预测。
2.1 预测异时性肝转移
近年来,有学者尝试结合深度学习与影像组学预测异时性肝转移,并取得初步成果。Lee等回顾性分析了2019例手术切除的Ⅰ~Ⅲ期结直肠癌患者, 按7∶3的比例划分为训练集和测试集,旨在通过DLR的方法构建预测5年异时性肝转移的模型。该研究基于术前
2.2 鉴别肝脏低密度结节
准确判断结直肠癌患者肝脏低密度小结节的性质具有重要临床意义。既往研究表明,此类结节中约9%~14%为恶性。Kim等纳入587例结直肠癌,按比例划分为训练集(502例患者,612个肝转移瘤、990个囊肿及153个
与上述研究结果相似,Khalili等纳入199例结直肠癌,按比例划分为训练集(150 例)和测试集(49 例),基于增强CT图像开发CNN模型用于鉴别肝脏低密度结节。其中良性结节通过1年随访或MRI典型表现证实, 恶性结节依据组织病理或全身化疗反应证实。结果表明,该模型诊断性能与拥有19年、17年和7年工作经验的放射科医生相近(CNN模型AUC:0.95;医生AUC:0.90~0.94),且低信心评级结节更少, 有望作为辅助工具提高放射科医生的诊断信心。但需注意的是,这两项研究均缺乏外部验证,其普遍适用性有待进一步确认。
2.3 明确肝转移来源
在临床实际工作中,有时需要明确肝转移是否来源于结直肠癌。活检或术后组织病理学检查是临床诊断金标准,但其具有侵入性,且难以全面反映肿瘤内部异质性。有研究通过构建基于增强CT的DLR模型,为鉴别肝转移瘤原发灶提供了有效途径。该研究回顾性收集了四个中心共489例肝转移患者,原发肿瘤包括结直肠癌(113例)、
运用深度学习算法构建DLR模型,同时训练逻辑回归、支持向量机等五种传统机器学习模型作为对照。结果显示DLR模型在所有分类任务中表现最佳,在五分类任务中,验证集和外部测试集的AUC分别为0.796和0.784。在消化道癌和非消化道癌分类任务中验证集和外部测试集的AUC分别达到0.907和0.818。
另一项研究则聚焦于胃肠道来源肝转移瘤原发灶的鉴别。该研究纳入47例结直肠癌和31例胰腺癌,基于CT图像,运用多种分类算法(包括极限梯度提升、随机森林等)和DenseNet-121算法,分别构建机器学习模型和深度学习模型, 并对比二者性能。结果显示,放射组学的K近邻分类器表现最佳,AUC为0.87, 准确率为67%;DenseNet-121分类器AUC为0.80,准确率为83%。但该研究受限于样本量小且缺乏外部验证。鉴于影像组学和深度学习的良好表现,后续可结合二者开展前瞻性多中心研究,进一步验证模型的可靠性。
3. DLR在CRLM疗效评估中的应用
手术切除肝转移灶是CRLM患者的标准治疗手段,然而,仅有10%~20%患者具有适应证。不可切除CRLM患者通常会选择全身治疗或在影像学引导下进行消融治疗。尽管上述治疗方式取得了一定疗效,但预后仍存在极大的异质性。随着深度学习技术发展, 基于神经网络的影像组学研究在CRLM中得到初步应用,为疗效评估提供了新的方法与思路。
3.1 手术切除
手术切除肝转移灶是目前最接近治愈CRLM的方法,但近四分之三的患者在术后16个月内会复发。Tang等基于138例CRLM患者(主要数据集)的多序列MRI,通过并行分支及多模态引导局部特征融合等模块提取特征, 构建了多模态引导互补网络模型,用于预测CRLM患者肝切除术后的复发情况。同时纳入102例肝细胞癌患者作为补充数据集,测试模型的泛化能力。结果显示,该模型表现优异,且泛化能力良好,在主要数据集和补充数据集的预测1年复发任务中, 准确率分别为79%和74%和,AUC分别为0.83和0.74, 在无复发生存预测任务中,C指数分别为0.73和0.68。
3.2 化疗
实体瘤疗效评价标准(Response Evaluation Criteriain Solid Tumours,RECIST)是临床评估化疗反应的主要手段, 但在观察治疗前后病灶内部特征的细微变化上仍有较大局限。Wei等为开发CRLM对于化疗药物反应(CAPEOX、mFOLFOX6、FOLFIRI或XELIRI方案)的预测模型,回顾性分析了192例不可切除CRLM患者的增强CT图像, 根据RECIST将131例确定为有反应者,61例被判定为无反应者。结果表明,基于ResNet10网络构建的DLR模型的预测能力较好,AUC在训练集和验证集分别为0.903和0.820,优于传统影像组学模型。癌胚抗原水平、肿瘤大小、平均CT值联合影像组学特征构建的联合模型,达到了对化疗反应的最佳预测效能,在训练和验证队列AUC分别达0.935和0.830。
与之类似,Maaref 等基于基线CT图像,利用深度CNN构建预测CRLM患者化疗反应的深度学习模型,同时构建传统影像组学模型及结合临床因素的联合模型。Davis等则运用注意力的多实例学习算法构建基于CT图像的深度学习模型, 并与临床模型对比。两项研究结果均表明,深度学习模型预测化疗反应的能力优于传统影像组学模型和临床模型。但上述研究均缺乏外部验证, 后续需要更多验证与优化,以促进模型的完善与临床应用。
Zhou等分析了多个中心共计307例CRLM患者的基线PET/CT图像、临床数据和结肠镜活检标本, 使用Resnet-34网络和EfficientNet-b3网络提取PET/CT图像特征,在对比了多个算法后,采用随机森林算法开发并验证了多模态DLR模型, 用于预测贝伐单抗在初始不可切除的CRLM患者中的疗效。结果表明将图像和临床特征作为输入的DERBY在外部验证队列中的AUC为0.77, 结合组织病理学特征后开发的DERBY+具有更高的准确率、敏感度和特异度,其在外部验证队列中的AUC为0.83。
同时该模型也具有预后价值,DERBY+模型预测为有反应者的患者,其无进展生存期、总生存期均显著长于无反应者(P=0.002,P=0.010),可为CRLM术前个性化治疗方案制定提供依据。尽管CT检查是评估肝转移瘤治疗反应最常用的方法,但MRI由于其高敏感性和特异性,已成为目前公认的检出和评估肝转移瘤最敏感的检查方式。
Zhu等对180例CRLM患者的化疗前后的T2WI和表观扩散系数(apparent diffusion coefficient,ADC)图像进行分析,构建基于CNN的深度学习模型。其中101例(264个病灶)被分入训练队列,54例(64个病灶)被分入测试队列,25例(61个病灶)作为外部验证集。根据肿瘤退缩分级将病变分为反应组和无反应组。结果表明该模型在评估化疗反应方面的准确率(87.5%、57.8%)和AUC(0.849、0.615)均显著优于RECIST标准,同时在外部验证队列中也显示出良好的性能(AUC:0.833)。
3.3 热消融
热消融区域后续发生局部肿瘤进展是消融技术目前面临的一大挑战。Zhao等纳入207例接受热消融治疗的CRLM患者,中位随访时间为56个月。将超声造影图像输入包含二维CNN、双向长短时记忆网络和注意力模块的深度学习模型, 同时通过逻辑回归算法构建临床模型, 并将二者结合构建联合模型,用于预测热消融术后早期复发。结果表明, 联合模型在外部测试队列中预测早期复发的AUC为0.78, 优于深度学习模型(AUC:0.76)和临床模型(AUC:0.67)。在早期复发风险分层方面, 深度学习模型在外部测试队列中能显著区分高、低风险组(P<0.001),优于临床模型(P=0.17)和联合模型(P=0.02),可以在临床实践中协助医生进行治疗决策。
4. DLR在CRLM预后评价中的应用
除了可以对肝转移进行诊断及评估疗效之外,DLR在评价CRLM预后方面也可提供帮助。
4.1 预测组织病理学生长模式
组织病理学生长模式是独立预后指标, 但目前只能术后确定。Starmans等纳入76例接受手术治疗的CRLM患者,按病理结果分为促结缔组织增生型和替代型。运用影像组学的方法对基于人工和Hybrid-Dense-UNet模型分割的增强CT图像进行特征提取和筛选, 运用最优放射组学分类工作流程工具盒构建决策模型。结果表明,该模型AUC为0.69, 基于组内相关系数选择特征或使用ComBat方法协调采集差异未显著改善模型性能, 且缺乏外部验证。
4.2 预后参数探索
鉴于已有研究提出肌少症或身体成分与患者生存有很强的相关性。有学者为此展开研究, 探讨身体成分和肝转移瘤负荷是否可以作为预测CRLM患者生存风险的参数。该研究纳入85例接受系统治疗的同步CRLM患者,基于治疗前腹部CT图像, 通过全自动提取流程评估腹腔身体成分,计算腹部肌肉与骨骼比等身体成分指标,同时运用nnU-Net架构自动分割肝转移灶,利用三角形网格法提取转移灶的体积和表面积。结果表明,腹部肌肉与骨骼比、肝转移灶表面积和原发肿瘤部位是总生存期的独立预后预测因子,SHAP(Shapley additive explanations)分析表明原发肿瘤部位对模型影响最大。
基于这三个参数,运用组件式梯度提升算法构建的预测模型C指数为0.69,但该研究没有进行外部验证, 且未纳入肝转移灶的影像组学特征, 后续可结合影像组学特征进一步分析腹部肌肉与骨骼比在早期结直肠癌和其他癌症中的预后价值。
5. 总结与展望
综上所述,DLR是人工智能结合医学影像领域中的一项新兴研究方法, 既提高了传统影像组学自动化水平,一定程度上简化了研究方法,又在不增加样本量的情况下进一步提升了模型的准确性和可靠性,在CRLM的诊断、疗效评估和预后预测中具有广阔的临床应用前景。但现有方法在临床推广中还存在一些挑战和局限性:首先是可操作性方面,由于影像学检查设备及构建模型算法的差异, 可能存在图像处理困难、模型难以泛化等问题,阻碍了临床实际应用。
其次, 基于DLR方法所提取的深度影像学特征缺乏可解释性, 应开展关于提高影像学特征可解释性的研究,进一步提升DLR方法在临床中的应用。最后, 虽然部分模型在外部验证队列中展现出良好性能,为结果可重复性及可信度提供了支撑,但大多数研究仍缺乏外部验证,且样本量相对较小,未来仍需融合多学科数据(如影像、病理、检验等),进一步开展更大规模、前瞻性、多中心、随机对照的研究,从而促进个性化精准治疗的发展。
来源:孔雅晴,黄笑语,岳晓宁,等.深度学习影像组学在结直肠癌肝转移诊疗中的应用[J].影像诊断与介入放射学,2025,34(02):117-122.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)