MRI在预测直肠癌新辅助放化疗疗效中的研究进展
2026-02-04 来源:磁共振成像
关键词: MRI 直肠癌 影像科

作者:杨瑷如,曹云太,侯昱胤,周伯琪,青海大学附属医院影像中心

 

国家癌症中心发布的2022 年中国恶性肿瘤疾病负担情况结果显示,结直肠癌(colorectal cancer,CRC)的发病率和死亡率均呈上升趋势,在所有恶性肿瘤中,CRC 的发病率居第2 位,死亡率居第4 位。CRC 手术患者中,直肠癌(rectal cancer, RC)约占CRC的57.6%。

 

RC早期临床症状隐匿,约一半以上的患者在初诊时已经发展为局部进展期直肠癌(locally advanced rectal cancer, LARC),即经影像学或病理检查发现的原发肿瘤侵出肠壁肌层直至周围有名结构(c/pT3-4b),或系膜内及真骨盆范围内出现淋巴结转移(c/pN1-2)而无远处转移(M0)的距肛门12 cm以内的RC。

 

目前,新辅助放化疗(neoadjuvant chemoradiotherapy, nCRT)后行全直肠系膜切除术(total mesorectal excision, TME)已成为LARC 国内外公认的治疗策略,可以提高保肛可能性并降低术后局部复发率。在nCRT 后,由于个体差异及肿瘤的异质性等因素,不同的患者会出现不同的肿瘤退缩分级(tumor regression grade, TRG),只有大约15%~27% 的患者能够实现病理完全缓解(pathologic complete response, pCR),即肿瘤细胞完全消失,只能观察到纤维化。

 

有研究表明,达到pCR 的患者,目前多主张“等待—观察”的治疗策略,进行额外的手术不仅不能进一步改善预后,反而会使患者的生活质量和功能结果恶化(包括肠道、泌尿和性功能)。因此,准确评估LARC患者nCRT 的疗效对于临床决策和个体化医疗具有重要意义。术后病理学检查是nCRT疗效评价的金标准,其中TRG是其主要内容之一。

 

然而,TRG分级系统是一种侵袭获得性指标,使其只能通过术后病理样本评估nCRT 疗效,存在一定的滞后性,不能于术前常规临床诊断。因此,开发一种无创、可定量化的方法检测LARC 患者nCRT 疗效,对选择合理的治疗方案和随访方案至关重要。而影像学作为一种无创的nCRT 疗效评估方法,可以实现LARC 患者nCRT 疗效的早期及动态评估。

 

目前LARC 术前nCRT 疗效评估常用的影像学方法包括计算机断层显像(computed tomography, CT)、MRI、超声(ultrasound, US),以及正电子发射型计算机断层显像(positron emission computed tomography,PET-CT)等。高分辨率盆腔MRI 因其空间分辨能力及软组织对比能力较好,已成为RC肿瘤分期分级和疗效评估的首选影像学手段。因此,利用MRI 相关技术在术前无创地预测LARC 患者nCRT 疗效具有重要的临床价值,尤其准确识别pCR,对后续的个性化精准治疗尤为重要。

 

本文旨在系统性地探讨常规MRI、功能MRI、MRI 影像组学及深度学习(deeplearning, DL)等MRI 影像技术和方法在评估LARC患者nCRT 疗效的研究进展,并对其未来发展趋势进行展望。

 

1. 常规MRI 评估nCRT疗效的价值

 

根据《2024 版CSCO 结直肠癌诊疗指南》,MRI因其对软组织的分辨率较高,且能够有效地描绘LARC 患者的原发肿瘤及其邻近区域,已成为RC 治疗和预后评估中极为关键的影像学工具。常规MRI对nCRT疗效的预测主要依赖于肿瘤体积和信号的改变,LARC患者nCRT后残余肿瘤呈等T2信号,而纤维化和(或)瘢痕则表现为短T2 信号。

 

临床上常根据PATEL 等首次提出的基于MRI 的肿瘤消退分级(magnetic resonance tumor regression grade, mrTRG)来进行疗效评估。mrTRG 评分来源于病理学中的TRG,分为1~5 级,该评分由nCRT 后的T2WI 图像中残余肿瘤与纤维化改变的百分比进行判定。然而,之后的多项研究结果均显示mrTRG与病理TRG之间的一致性较低(Kappa 值为0.25~0.36 之间、Kappa 值为0.240等),这种差异可能源于nCRT后直肠肿瘤的反应具有高度复杂性,以及T2WI 序列在区分肿瘤残余与直肠局部的水肿、瘢痕及纤维化等治疗后变化方面存在局限性。

 

YOEN等研究发现在T2WI 图像上添加扩散加权成像(diffusion-weighted imaging, DWI)会提高mrTRG 观察者间的一致性,这与PANG 等的研究结果一致。此外,评估治疗前后肿瘤体积差异以预测TRG的策略,也显示出了较高的预测准确性。KIM等的研究揭示了基于T2WI 序列下勾画的肿瘤体积能有效预测TRG。

 

LUTSYK等研究发现全瘤体积<39.5 cm3是预测肿瘤TRG反应良好的显著因子。常规MRI 在评估LARC 患者接受nCRT 后的疗效时,通过监测肿瘤信号和体积的变化,提供了形态学评估的重要视角。然而,由于nCRT 的疗效并不总是通过肿瘤体积的缩小来体现,且肿瘤坏死的严重程度可能不直接反映在形态学变化上,因此,对肿瘤组织的功能变化进行评估显得尤为关键,这对于指导患者的个性化治疗策略至关重要。

 

2. 功能MRI 评估nCRT疗效的价值

 

随着影像技术的革新和进步,DWI、体素内不相干运动(intravoxel incoherent motion, IVIM)和弥散峰度成像(diffusion kurtosis imaging, DKI)等功能MRI也逐渐应用于LARC 患者的疗效反应评估中。上述功能成像技术在显示基本肿瘤形态学改变的同时,还可获得基于水分子扩散而引起的功能活动方面的指标,进一步反映肿瘤及周围组织的微环境状态,为评估nCRT疗效提供了更全面的信息。

 

2.1 DWI 评估nCRT 疗效的价值

 

DWI 技术依托于水分子在生物组织中的随机布朗运动,以评估活体组织中细胞外间隙内水分子的运动差异,并通过表观扩散系数(apparent diffusion coefficient, ADC)对这些运动进行定量分析。在nCRT 后,DWI 信号降低,ADC 值升高,通常指示nCRT 治疗反应良好。因此,通过监测nCRT 前后ADC 值的变化(ΔADC%),可以对nCRT 的疗效进行早期评估,为临床提供关键的预后信息。

 

ZHAO等回顾性收集了91 例病例,分析治疗前后的DWI序列,结果显示治疗前的ADC 值及ΔADC%对肿瘤反应均有预测意义。BORASCHI 等通过分析41 例LARC 患者nCRT 前后的多b 值DWI 序列,发现治疗后的ADC值及ΔADC%值是病理TRG的有效预测因子,但治疗前ADC 值并未表现出相关性。ZHAO等和BORASCHI 等的研究均展现了ΔADC%预测nCRT 疗效的价值,但关于治疗前ADC 值能否预测nCRT 疗效这一问题却得出了相反的结论,这可能由于样本量小、人种差异等原因,未来需要在大样本中深入探索。

 

DWI 模型以其简洁性、便捷性和易于解释的特点,在临床实践中得到了广泛的应用。然而,针对使用ADC 值来预测TRG 的研究,学术界尚未形成统一的结论。此外,单一指数模型难以准确捕捉体内环境的复杂性,无法充分反映影响水分子扩散的多种生物物理因素。

 

2.2 IVIM 评估nCRT 疗效的价值

 

IVIM是基于双指数模型的DWI 衍生序列,与单指数模型相比,IVIM模型能够将低b 值范围内的微血管灌注效应与高b 值范围内的水分子真实扩散效应分离,从而更精确地描绘组织的微观结构和病理变化。IVIM模型的关键定量参数包括水分子的固有扩散系数(D)、灌注相关的假扩散系数(D*)以及反映微血管灌注比例的灌注分数(f)。

 

先前的研究表明相较于灌注相关参数(D*和f)以及基于单指数模型计算的ADC 值,ΔD%值在预测LARC 患者nCRT治疗反应良好显示出更高的准确性,提示D 值可成为预测LARC 患者nCRT 疗效的潜在生物标志物。

 

HU 等的研究指出相较于传统DWI 模型,IVIM模型在识别LARC 患者nCRT 后pCR 与良好反应组方面具有较高的诊断价值:在nCRT 后,LARC 患者的ADC和D值均显著增加;在pCR组,治疗前D*和f、治疗后D*以及ΔADC%和ΔD%均较非pCR 组显著更高;肿瘤反应良好组治疗后D、ΔADC%和ΔD%值更高;逻辑回归分析表明,ΔADC%和ΔD%是nCRT 疗效反应的有效预测因子;ROC曲线分析进一步证实,ΔD%的AUC 值较ΔADC%更高。这与WEN 等的研究结果基本一致。

 

2.3 DKI 评估nCRT 疗效的价值

 

传统DWI 模型假设水分子扩散遵循高斯分布,但实际上生物组织中的扩散因细胞结构而呈现非高斯特性。在DWI 基础上衍生的DKI 利用非高斯模型分析水分子扩散,可以在一次扫描中获得平均峰度(mean kurtosis, MK)和平均扩散率(mean diffusion,MD)等指标来评估水分子的扩散程度和量化扩散差异。

 

YANG等前瞻性研究分析了42 例LARC患者,比较了DWI、IVIM模型和DKI 模型在评估LARC 患者对nCRT反应中的应用价值,结果显示pCR组治疗后ADC、D*、f、MD值均显著高于非pCR组,其中MD值显示出最高的诊断准确性(AUC为0.788),这表明DKI 模型能更精确地描绘肿瘤内部水分子的扩散动态。

 

与之相似,BATES 等研究发现MD值较高的患者在治疗后位于TRG反应良好组的可能性更大,而MK 值并未显示出类似的相关性。LI 等的研究结果则显示:与ADC值、MK值相比,MD值具有更好的诊断效能,且MD变化百分比的诊断效能最好,AUC值可达0.939。上述研究结果表明DKI 技术MD值在LARC 患者nCRT 治疗前疗效预测展现了良好的潜力,但与其他功能MRI 类似,DKI 技术在临床应用中仍面临一些挑战,包括目前仍面临缺乏统一的标准以及样本量有限等问题。因此,为了保证DKI 预测nCRT 疗效的可靠性和稳定性,需要开展多中心、前瞻性的研究来进一步验证。

 

除了以上几种较为常见的功能MRI 技术,还有部分学者使用酰胺质子转移成像(amide proton transfer, APT)、合成MRI 等MRI 新技术评估LARC患者nCRT疗效。CHEN等回顾性研究53 例LARC患者,在nCRT 前后进行MRI 检查,包括APT 和DWI,结果显示治疗前APT、ADC值联合的诊断性能最佳(AUC 为0.895)。

 

LIAN等前瞻性研究招募了63 例LARC患者,研究发现nCRT 后pCR组及T 降期组的平均T1、T2 值显著降低,这表明合成MRI 衍生的T1 弛豫时间和T2 弛豫时间值是预测nCRT良好反应的有前途的影像学标志物。另外,MA等研究发现使用MTR-Net 技术从DWI 图像生成合成DKI 图像是可行的,合成DKI 图像预测pCR 的效率与真实DKI 图像相当。以上MRI 相关技术在预测LARC 患者对nCRT 反应中的应用尚不广泛,研究潜力和发展前景巨大。

 

3. 影像组学评估nCRT疗效的价值

 

相比于常规MRI 与功能MRI,影像组学通过高通量技术从多模态医学图像中( 如CT、MRI、PET-CT、US 等)提取影像学特征,挖掘超过人类肉眼辨别范围之外的更深层次特征,来实现医学图像分割、特征提取,并通过建立机器学习模型对影像和临床进行分类、评估和预测,进而帮助临床医生进行精准治疗。目前,国内外的研究者们正利用影像组学分析LARC患者nCRT 治疗前后的影像数据,以便在术前准确预测TRG,指导个体化治疗。

 

YARDIMCI等使用治疗前矢状位的T2WI 图像中提取影像组学特征并构建模型,以预测LARC患者对nCRT的反应。结果显示与仅使用临床信息的模型相比,该模型表现出最高的预测准确性和卓越的临床效用(AUC 值为0.753)。

 

类似地,ANTUNES 等基于nCRT 前的T2WI图像构建随机森林(random forest, RF)分类器组学模型,AUC 值为0.712。CUSUMANO 等选择了195 例LARC 患者,其中136 例患者使用1.5 T MR 扫描仪扫描,59 例患者使用3.0 T MR扫描仪扫描,然后使用他们nCRT治疗前的T2WI 图像预测nCRT疗效,结果显示合并数据集模型的AUC 值为0.72,而1.5 T数据集和3.0 T 数据集的AUC值分别为0.70 和0.83,这不仅展现了MRI 影像组学预测nCRT疗效的价值,还表明可以通过选择合适的图像特征来克服磁场强度变化。以上研究肯定了MRI 影像组学用于评估nCRT 疗效的重要效能,但模型预测性能一般。

 

为了进一步提高模型的性能,很多学者的研究使用了nCRT 治疗前多参数MRI 图像。在WANG 等的回顾性研究中,基于T2WI、DWI、DCE-MRI 的多参数MRI 影像组学特征并使用支持向量机(support vector machine, SVM)分类器和最小冗余最大相关(minimum redundancy maximum relevance, mRMR)-最小绝对收缩和选择算子(least absolute shrinkage and selection operator, LASSO)特征选择器的预测模型对nCRT反应不佳者的术前预测性能最佳(AUC值达到0.923)。

 

类似地,CUI 等的研究使用了治疗前T2WI、DCE-MRI、ADC 多参数MRI 图像构建影像组学标签,结合临床危险因素绘制列线图,其AUC值在训练集和验证集中分别达到0.948、0.966。值得关注的是,前述研究集中于利用治疗前获得的影像资料,这使得在nCRT实施前对疗效进行预测成为可能。这种预测能力对于指导临床治疗方案至关重要,它能够识别那些可能不会从nCRT 中获益的患者,从而避免他们承受不必要的治疗相关毒性和手术延迟的风险。

 

FERRARI 等提取nCRT前、中、后的T2WI 图像影像组学特征来预测nCRT疗效,AUC值为0.86,高于CUI等研究中仅依靠nCRT前T2WI图像的研究,这表明结合nCRT前、中、后等多时间点的组学特征有利于让模型的诊断效能更高,未来可以探索更多时间点。

 

SHIN 等基于nCRT 后T2WI 及DWI 图像的影像组学模型预测LARC患者nCRT疗效并与专业的放射科医师的评估进行了比较,结果显示该模型诊断LARC患者nCRT 疗效的效能优于经验丰富的放射科医师。李颖使用逻辑回归分类器构建了3 个用于nCRT疗效预测的模型,分别为基于nCRT前MRI 的影像组学模型(R1 模型)、基于nCRT 后MRI 的影像组学模型(R2 模型)以及delta 影像组学模型(R3 模型),结果显示R3 模型的预测效能最高,其在测试集中的敏感度为88%,特异度为77%,精确率为62%。

 

SHAYESTEH等研究了基于MRI的治疗前、治疗后和delta影像组学特征在预测LARC患者对nCRT 反应方面的性能,发现基于delta 影像组学的RF 模型实现了最高的AUC值可达到0.96,该研究不仅展现了MRI影像组学对nCRT疗效的评估价值,还比较了采用不同机器学习分类器对模型效能的影响。

 

长期以来,大多数研究都致力于肿瘤本身的研究,而随着研究的不断深入,GU等首次提出肿瘤周围微环境(peritumor microenvironment, PME)的概念。研究表明,瘤周组织肉眼所见与正常组织相同,但实际在微观上具有异质性。

 

QIN 等的研究结果验证了LARC 患者瘤内和瘤周影像组学特征的整合,尤其是与直肠系膜血管和淋巴结相关的特征,是LARC患者nCRT 疗效评估的有效预测因子(AUC值为0.859)。QIN 等还根据源自肿瘤和直肠系膜的MRI 影像组学特征,建立接受nCRT 的LARC患者病理反应和淋巴结转移的预测模型,结果显示肿瘤和直肠系膜的治疗前和delta 影像组学特征的融合模型性能最好,其AUC值分别为0.874(pCR)、0.801(病理反应良好)和0.826(淋巴结转移)。

 

相似地,ZHU等共纳入82 例患者,通过影像组学特征的选择,构建了基于肿瘤体积、直肠系膜脂肪和delta 的基线MRI 的影像组学模型。训练组和测试组多参数影像组学融合模型的AUC 值分别为0.852 和0.848,表现出较高的预测性能和良好的校准效果。

 

GUO等探讨了瘤内、瘤周和联合特征与总生存期之间的相关性,结果显示联合模型(AUC=0.954 和0.821)比瘤内模型(AUC=0.833 和0.813)和瘤周模型(AUC=0.824 和0.687)具有更好的生存相关性。另外,还有很多研究者探索将临床病理特征与MRI 影像组学相结合,以构建综合模型来预测LARC 患者nCRT 的疗效。

 

WANG 等回顾性纳入3 个中心的285 例具有完整治疗前临床特征和T1WI 和T2WI 图像的患者进行分析,结果显示临床影像组学融合模型显示临床完全缓解和pCR的区分最佳,平均AUC值为0.718 和0.810。

 

HU等从回顾性和前瞻性招募的1070 例LARC患者的T2WI 和ADC图像中提取影像组学特征,创建用于良好反应预测的影像组学模型,将性能最佳的影像组学模型与重要的临床特征相结合,以创建融合模型,该模型显示出最佳的性能,其AUC值在训练集、外部验证集1、外部验证集2 和前瞻性验证数据集中分别为0.799、0.797、0.754和0.727。

 

MARINKOVIC等构建了两个预测模型,一个从72 临床参数和107 影像组学特征开始,另一个从72 临床参数和1862 影像组学特征开始,它们在整个队列中的预测AUC 值分别为0.86 和0.90,这不仅肯定了临床影像组学融合模型的效能,还揭示了增加维度的有利影响。除了一些常见的临床特征,LOSURDDO等研究发现基于影像组学特征和miRNA-145 表达水平的整合模型表现最好(AUC值为0.90),与TRG显著相关。目前,大多数的研究都采用手动分割,费时费力,还需评价勾画病灶的一致性,但DEFEUDIS 等使用U-net 算法手动和自动分割肿瘤体积,结果显示自动分割的准确率、敏感度等指标均高于手动分割。

 

FILITTO等的研究同样证实采用自动勾画肿瘤区域的影像组学方法在预测nCRT后TRG方面具有较高的效能,其AUC值达到了0.89。肠腔属于空腔脏器,形态和肿瘤位置并不完全固定,且肿瘤边缘大多数不规则,因此未来需要不断改进自动分割的方法,使肿瘤的勾画更加精细。

 

LI 等联合CT 和MRI 多序列构建了多模态影像组学模型,该模型在训练集和验证集的AUC 值分别为0.925、0.93,证实了使用术前CT 和MRI 影像组学的多模态列线图提高了治疗结果预测的准确性,从而有助于LARC新辅助治疗的个性化选择。同样地,BORDRON等开发了一种基于MRI 和对比增强CT的影像组学模型,并使用ComBat 方法校正模型的不稳定性,结果显示ComBat 协调后的联合模型效能最好(平衡精度为85.5%)。

 

FENG等在一项多中心研究中联合影像组学及病理组学构建RAPIDS 模型,该多模态预测模型在训练集、两个外部验证集和一个前瞻性验证集中的AUC值分别为0.868、0.860、0.872 和0.812,优于单模态预测模型(病理组学微环境模型的AUC 值为0.630,MRI 影像组学模型的AUC 值为0.716,病理组学细胞核模型的AUC值为0.733),说明了MRI 影像组学结合其他组学的多模态模型可以使单纯的MRI 影像组学模型更加完善。WAN等同样验证了一个结合影像组学和病理组学特征的模型可有效预测LARC患者nCRT 后的病理良好反应(训练集和验证集的AUC值分别为0.93和0.90)。

 

4. DL 评估nCRT疗效的价值

 

DL 技术是基于人工神经网络架构的机器学习的一个分支,能够对大量的RC影像进行深入地分析和挖掘,相较于传统影像组学,它不需要人工定义特征,具有节省时间、操作一致性高和可重复性强的优势,从而提升对RC 诊断的精确度和效率。近来,许多基于DL 的研究预测LARC患者nCRT 的疗效都展现了良好的价值。

 

CHEN 等研究发现与传统的影像组学方法相比,基于DL特征集的预测模型(AUC=0.846)明显优于传统的影像组学方法(AUC=0.714),且3D- 卷积神经网络(convolutional neural network,CNN)特征比2D-CNN 特征更具可预测性。LI 等开发的DL 工具DeepTOP 通过使用MRI 图像特征预测LARC 患者pCR,其预测经nCRT 后pCR 的准确度、特异度及敏感度分别为78.9%、72.5%和81.2%。

 

HU 等通过使用CE-Net 以端对端的形式提取MRI和CT 图像特征并自动分割图像,再结合CNN 实现pCR 预测的AUC 值为0.833,相比单独基于CT 或MRI 的DL 模型预测pCR 的性能更优。ZHOU 等通过使用或不使用注意力机制构建基于多序列融合的DL 和影像组学模型进行比较,研究发现使用注意力机制构建的DL 模型预测LARC患者nCRT 反应的性能最好,其在内部与外部验证集中的AUC 值分别为0.898 和0.873,且使用注意力机制的模型较未使用注意力机制的模型性能更好。

 

随着研究的不断深化,研究者们开始不仅限于探索MRI的常规序列,还尝试整合功能性序列以增强诊断和评估的效果:ZHANG等基于T2WI 和DKI 图像,利用DL 建模,发现基于DKI 的DL 模型在预测pCR方面具有良好的性能,有助于放射科医生评估nCRT后LARC患者的反应。

 

5. 小结

 

常规MRI 在评估nCRT 疗效方面具有一定的诊断价值,但其准确性受到肿瘤治疗后纤维化和细胞水肿的影响。功能MRI 能够进一步揭示肿瘤内部微环境,但该技术目前仍面临缺乏统一的标准以及样本量有限等挑战,未来需要通过大规模、标准化的前瞻性研究来验证其诊断可靠性。MRI 影像组学技术能够提取大通量特征,但其特征提取过程既耗时又费力。

 

DL 技术能够直接从原始数据中提取模式识别信息,有效克服了传统影像组学的这一限制。尽管如此,DL 模型在LARC 患者nCRT 疗效评估中的临床应用仍受限于模型透明度和可重复性的问题。综上所述,应用常规MRI、功能MRI、MRI 影像组学及DL 等先进的MRI 影像技术和方法对LARC患者nCRT 后的疗效进行预测,能够为制订患者的后续治疗策略提供关键依据,进而改善患者的预后和生存质量,但也都存在一定的问题。

 

因此,未来的研究方向应包括开展大规模前瞻性研究,以减少DL 模型的过拟合风险,从而增强模型的稳健性。随着人工智能的进步与发展,以及图像获取及处理流程的规范化,预计影像组学方法将得到大规模前瞻性多中心研究的验证和广泛应用。同时,DL 算法的持续发展和生境分析等新兴技术的提出及合理应用会进一步提高影像组学及DL在预测nCRT疗效方面的效能,这对于实现LARC 患者早期制订治疗方案以及后期逐步实现精准医疗具有重要意义。

 

来源:杨瑷如,曹云太,侯昱胤,等.MRI在预测直肠癌新辅助放化疗疗效中的研究进展[J].磁共振成像,2025,16(02):204-209+214.


(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)

0
收藏 分享