作者:蔡传磊,赵俊功,上海交通大学医学院附属第六人民医院
1. DCE-MRI在诊断PCa中的价值被弱化,其原因何在? 临床上可以不使用DCE-MRI吗?
mpMRI已被证明是检测显著临床意义的前列腺癌(clinically significant prostate cancer, csPCa)以及危险度分层的有效方法。而作为mpMRI的重要序列,DCE-MRI在临床诊断中的价值随着PI-RADS的更新也被临床工作者们不断重新认识。最新的荟萃分析表明,对于模棱两可的病灶(即PI-RADS 3分或Likert评分为3分的病灶),DCE-MRI诊断为PCa的敏感度、特异度分别是0.57、0.58,诊断为csPCa的敏感度、特异度分别是0.67、0.58,诊断csPCa和PCa时,DCE-MRI曲线下面积(AUC)分别是0.67和0.60,提示DCE-MRI的诊断效能较低。
这其中的原因,除了研究设计、磁场强度、csPCa 的定义、病灶的评分差异外,还在于DCE-MRI自身的原因:一方面是对DCE-MRI的定量分析方法是基于经典的Tofts 或Kety药代动力学模型(即特定组织,如血脑屏障)然后移植至体部来应用,而不同的厂家、软件商提供的分析软件差异大,不同的研究其结果差异大,可比性差;另一方面,不同的研究者所使用的DCE-MRI的扫描技术和扫描方案不同,导致DCE-MRI的时间分辨率(temporal resolution, RT)、空间分辨率(spatial resolution, Rs)差异大。
虽然在PI-RADS v1.0时,DCE-MRI是mpMRI检查的重要组成部分,而在PI-RADS v2.0及PI-RADS v2.1时,DCE-MRI在临床诊断中的价值仅用来区分外周带(peripheral zone, PZ)模棱两可的病灶,即根据DCE-MRI上病灶有无早期强化来确定病灶属于PI-RADS评分为4分或3分,或避免遗漏小而重要的病变。
DCE-MRI需要静脉注射钆对比剂,这需要花费额外的时间和成本,并且基于钆对比剂的相关潜在毒性(例如过敏、脑组织沉积和肾源性系统纤维化),其应用变得谨慎。鉴于DCE-MRI有限的作用以及其额外的时间和成本,人们对在没有DCE-MRI的情况下进行前列腺MRI诊断越来越关注。研究者尝试应用仅包括T2WI和扩散加权成像(DWI)双参数磁共振成像(bpMRI)来替代mpMRI。
多项研究结果表明,bpMRI与mpMRI对csPCa的检出率和诊断准确率相似,不过bpMRI对csPCa的检出率和诊断准确率显著依赖于研究者的经验和高质量的DWI图像。也有研究表明,由于DCE-MRI阳性发现,在PI-RADS和Likert量表等PCa评分系统中,3类病变的患者升级为4类,DCE-MRI在检测可疑病变的csPCa和PCa方面没有增加足够的益处。然而,更多的研究对比了bpMRI和mpMRI的诊断效能,证实了mpMRI的必要性。
与bpMRI相比,mpMRI在视觉分级特征(VGC)分析中,病变的可见度明显更好,AUCVGC为0.6。mpMRI的可见度评分明显高于bpMRI,与单独的T2WI相比,DCE-MRI和DWI图像独立地提高了病变的可见度。DCE-MRI获得的附加信息可能对临床决策产生潜在的有意义的影响。
有研究表明,将DCE-MRI添加到PZ的DWI中是有益的(OR=2.0;P=0.027),表明当PZ中DCE对任何DWI评分呈阳性时,发现PCa的概率高出两倍。PI-RADS 2、3和4类病变的癌症检出率分别增加了15.7%、16.0%和9.2%。对于PZ病变,DWI和DCE-MRI预测的模型的整体拟合度是合适的(拟合优度检验,P=0.356),OR为2.45;对于移行带(TZ),观察到的癌症检测概率表现出很大的可变性,这与预测模型没有很好的解释(拟合优度检验,P=0.009)。故DCE-MRI对于PZ病变具有很高的检测价值,应该与其他序列相结合进行PI-RADS评分,以更准确地对风险进行分层。
在临床实践中,DCE-MRI的作用并非仅限于外周带模棱两可的病灶,43.5%(87/200)的患者因为直肠气体或其他原因导致DWI、T2WI图像变形,致使36.8%的PI-RADS 4~ 5病灶若没有DCE的辅助而被低估。
在前列腺穿刺后或PCa病灶内出血DCE-MRI不可或缺,DCE-MRI在评估治疗后的局部复发时仍然至关重要。此外,对于已知会改变前列腺形态的前列腺干预[经直肠超声引导前列腺活检(TRUS)/经直肠前列腺切除术/良性
Breit等应用更高的RT(2.5 s)和更高的Rs(0.56 mm×0.56 mm)得到的DCE-MRI,由时间信号强度曲线而非模型所衍生出来的定量参数在PCa和正常组织间差异明显,当然没有得到基于表观扩散系数(ADC)的鉴别水平;而把ADC与DCE-MRI结合起来后,显著提高了穿刺阳性与穿刺阴性、Gleason 6与Gleason≥7病灶的鉴别水平。该研究唤起了广大研究者对DCE-MRI在PCa诊治中价值的再认识。而提高DCE-MRI的稳定性和可重复性应是当务之急。
2. 在PCa诊治中如何更有效合理地使用DCE-MRI
2.1 提高时间分辨率与空间分辨率是提高DCE-MRI的稳定性的切入点
由于前列腺是一个血管丰富的器官,并且PCa病变的很大一部分横截面直径<1 cm, 因此需要高分辨率来区分良性病变和恶性病变。Rs和RT之间的内在平衡是提高DCE-MRI稳定性所面临的重要挑战,寻找到相对合理而稳定的Rs和RT对于提高DCE-MRI稳定有很大帮助。
与传统的动态MRI检查技术相比,DCE-MRI通过使用压缩感知黄金角径向稀疏并行(golden-angle radial sparse parallel, GRASP)新技术可提供更高的Rs和RT,DWI结合GRASP技术得到的定量参数容积转运常数(Ktrans)或速率常数(Kep)使诊断性能得到了提升,DWI结合传统DCE-MRI则无额外益处。由GRASP技术进行的DCE-MRI所衍生出来的7项参数在区分正常前列腺组织和PI-RADS为4或5病变方面、穿刺阴性的病灶与穿刺阳性的病灶、Gleason 6与Gleason ≥7 病灶的差异显著,DWI结合DCE-MRI较单独的ADC或单独DCE-MRI诊断性能得到了提高。
需要指出的是,仅提高RT而不提高Rs并不能提高诊断性能。传统的DCE-MRI的RT取值范围为2~18.5 s, 在GRASP序列中,RT为2.5 s; 传统的Rs范围为3.0 mm×0.5 mm×0.6 mm到4.0 mm×2.8 mm×2.8 mm, GRASP序列的Rs为2.5 mm×0.56 mm×0.56 mm。与传统的DCE-MRI序列相比,GRASP序列的Rs和RT同时提高。
过高的RT是否会影响由DCE-MRI衍生出来的定量化参数?Ream等评估了DCE-MRI的不同的RT(1.4 s, 3.7 s, 6.0 s, 9.7 s和14.9 s)对PCa定性检测和定量药代动力学参数的影响。RT值1.4 s与14.9 s (4.29±1.23 vs. 3.46±1.44;Padj=0.029),对于检测GS≥4+3肿瘤的显目性更高。但肿瘤和良性组织的Ktrans和血管外细胞外间隙容积分数(Ve)在不同RT中没有差异(所有调整后的Padj=1.000)。
RT对用以区分肿瘤良恶性的Ktrans或Ve的AUC没有显著影响(均为Padj=1.000)。进一步降低至RT≤7 s对肿瘤检测或定量分析没有益处。将RT增加到14.9 s不会影响PCa的定量评估,也不会影响敏感性;将RT进一步降低到9.7 s以下似乎对肿瘤检测没有任何益处。有鉴于此,美国放射学会(American college of radiology, ACR)建议15 s或更短的RT用于描述前列腺血管特征,10~15 s的RT被设定为前列腺DCE-MRI的最低要求。
在前列腺的DCE-MRI中,RT会影响半定量参数的诊断性能。RT对wash-in的影响显著(F5290=19.3,P<0.001),在5 s(P<0.001)、10 s(P<0.016)与其他RT之间均存在显著差异;对于wash-out影响不显著;对达峰时间(TTP)的影响显著(F5290=20.4,P<0.001),5 s(P≤0.028)以及10 s(P≤0.003)与所有其他RT之间存在显著差异。而药代动力学参数(即Ktrans、Kep和Ve)保持不变,无显著差异。
因此,在运用DCE-MRI时,要兼顾Rs和RT之间的内在平衡,一味地求快并不能得到很好的诊断性能;此外,还要注意RT对半定量、定量参数的影响。
2.2 由DCE-MRI衍生出的半定量和定量方法,孰优孰劣?
前列腺肿瘤灌注的改变被认为是由肿瘤血管生成引起的,增强模式的定性评估以及DCE-MRI采集的定量或半定量参数在组织学上与肿瘤血管生成标记物相关,包括血管内皮生长因子(VEGF)表达和肿瘤微血管密度增加。与正常前列腺组织相比,PCa的DCE-MRI特征是,对比剂的强化更早更快,廓清也更早。临床上有3种不同的DCE-MRI评估方法:定性、半定量和定量方法。
定性方法: 在PI-RADS v2.0及PI-RADS v2.1中,当PZ的病灶在DWI被评PI-RADS 3时,若出现局灶性早于或与邻近正常组织同时强化,DCE-MRI即为阳性,相应的病灶升级为PI-RADS 4。但是在定性诊断中,对于最适合的RT值应为多少研究较少。
半定量方法: 微血管密度与PCa患者的肿瘤分期、复发、转移潜能和预后相关,这种灌注信号增强可从时间信号强度曲线中衍生并通过半定量分析进行量化。时间信号强度曲线显示的半定量参数,包括最大斜率(the maximum slope, MS),开始时间(time to start, TTS),最大斜率时间(time-to-maximum slope, TTSM),wash-in, wash-out, 最大剩余功能时间(time to maximum, TTM)、峰值增强强度(PEI)和60 s曲线下的初始面积(iAUC),以及最大标准化摄取值(SUVmax)。
由DCE-MRI灌注参数衍生的半定量分析结果表明,恶性病变的TTP明显短于良性病变,SUVmax明显高于良性病变(P<0.05),其他参数无显著差异。MS,TTS,TTSM在正常前列腺组织与PI-RADS为4或5病变方面、穿刺阴性的病灶与穿刺阳性的病灶间的差异显著。由于RT影响半定量参数的诊断性能,对wash-in和TTP有显著影响(P<0.001),在对定量参数(Ktrans、Kep和Ve),未检测到RT的显著影响(P<0.112)。在目前的研究中,来自良性和潜在恶性病变的半定量参数主要在10 s或更小的RT下稳定,而更低的RT会导致虚假估计,并降低wash-in的诊断准确率。
定量方法: 1989年首次描述的使用Tofts模型对DCE-MRI进行定量药代动力学建模是一种最为流行的方法。这是一种双室分析,其中计算对比剂在灌注过程中迅速从血管室扩散到组织室(间质空间),并在“廓清”过程中返回到血管室。
一系列研究比较了DWI和DCE-MRI对PCa的诊断价值,与定量DWI指标相比,DCE-MRI对肿瘤侵袭性的诊断性能相对较低。作为渗透率指标,与Gleason评分(GS)相关性低的一个原因是并非所有csPCa在DCE-MRI上都显示强化。DCE-MRI上的通透性指标和强化效果仅在中低危肿瘤和GS≥4+4等高危肿瘤之间存在显著差异,这表明PCa中的新生血管可能在高危肿瘤中迅速发展。
荟萃分析试图在大量样本(涵盖894例患者的13项研究)的基础上,探讨DCE-MRI定量参数与GS关联性,主要是GS和平均Ktrans、Kep和Ve值之间的相关性以及标准差。结果表明只有Ktrans的相关性最高,但合并相关系数r=0.36,Kep合并相关系数r=0.23,Ve合并相关系数r=0.05;在鉴别分析中,每个DCE-MRI参数在csPCa和非csPCa之间存在严重重叠。因此,单独DCE-MRI不能可靠地预测GS评分,也不能很好地区分csPCa和非csPCa。
DCE-MRI定量参数却可以预测放疗后复发患者高能聚焦超声(HIFU)局部治疗疗效,在单变量分析中,
值得注意的是,由于心输出量和全身血流模式的变化,Ktrans和Ve受到患者间动脉输入功能(AIF)的巨大变化的强烈影响,分次注射对比剂(先注射30%,2 min后注射70%)可以减少AIF的干扰。在一项评估不同人群平均动脉输入功能(pAIF)对DCE-MRI药代动力学参数的影响及其对潜在恶性前列腺病变的诊断准确率的研究中,ROC分析显示,选择不同的pAIF类型会导致药代动力学参数估计的高度可变性,不同pAIF(即,快、中等或慢)的诊断准确率具有可比性,Ktrans和Kep的诊断准确率较高,而Ve的诊断准确率较低。因此,在DCE-MRI研究中,保持AIF类型选择恒定是非常重要的。
有鉴于此,有研究尝试无需AIF的新方法来计算药代动力学参数。Ginsburg等的研究通过利用PZ和TZ之间药代动力学特性的固有差异,开发和评估一种基于前列腺的方法(PBM),用于评估DCE-MRI的药代动力学参数。结果表明,在PCa病变与良性组织之间TZ病变(26/27例)的PBM-Ktrans与PZ病变(33/38例)的PBM-Ktrans存在显著性差异(P<0.05);而基于AIF的Ktrans分别在26例和30例患者中出现显著差异;基于PBM的Ktrans和Ve其第75百分位数与第100百分位数与肿瘤大小正相关。该研究表明,在PCa的检测方面,基于PBM的药代动力学参数胜过基于AIF的药代动力学参数。
3. 人工智能是提高DCE-MRI的可重复性的有效途径
机器学习(machine learning, ML)可以对数据自动分析处理,降低了以前不同经验的研究者对DCE-MRI的数据手工分析所产生的差异,能够发现人眼难以发觉的微小差异。基于ML的影像组学分析有助于提高前列腺图像评估的可重复性,提高PCa诊断准确率。特征驱动学习技术作为ML的一种方法,展示出有希望的结果。该技术先输入一组预定义的图像或患者特征,在进行已知结果的初始训练阶段之后,可以使用这些模型预测未知数据的结果。此外,可以分析训练后的模型,洞悉哪些输入特征与区分临床相关PCa风险组最相关。
ML的优势还在于其能够在定量数据中找到相关模式,而这些模式可能无法通过单独的定性评估来发现。例如将采集到的高分辨率(RT2.5 s/帧;Rs0.56 mm×0.56 mm)的DCE-MRI的灌注信息添加到T2WI/DWI序列中作为梯度推进机器(gradient boosting machine, GBM,ML的一种算法)分类器的输入特征,从而比单独使用T2WI/DWI序列更好地对PCa危险组进行分类。使用GBM作为ML算法,还可以提取每个输入特征的贡献权重。
GBM分类器在利用灌注信息对良性和恶性组织变化进行分类时显示出更高的敏感度和特异度,有灌注信息的ML模型优于无灌注信息的相关模型(P<0.001),ADC是影响最大的参数,其次是T2WI、Kep和Ktrans;在分析区分中级与高级PCa的诊断性能时,有灌注信息的ML模型胜过无灌注信息的相关模型(AUC值分别为0.909和0.700,P=0.038),Kep和Ktrans主导了参数对分类器的相对影响,其次是ADC,相对作用较小。
另一项研究制作了多个ML模型进行对比。测定所有病变的灌注相参数(Ktrans、Kep、Ve)、ADC和T2绝对信号强度,并将其作为四个ML模型的输入参数:GBM、神经网络(NNet)、随机森林(RF)和支持向量机(SVM)。将4个ML模型结果和PI-RADS评分与基本事实进行比较,并绘制ROC曲线和计算AUC值。结果表明,所有ML模型在预测csPC方面均优于PI-RADS v2评分(RF、GBM、NNet、SVM、PI-RADS的AUC分别为0.899、0.864、0.884、0.874、0.595,P均<0.001)。在训练数据集中,使用GBM和RF模型达到了最高AUC值,灵敏度和特异度均为100%。SVM模型在AUC值方面优于NNet模型(0.969 vs.0.863)。ML技术已经被证明能够利用这些对于阅片者来说并不明显的细微的数据差异。
来源:蔡传磊,赵俊功.在前列腺癌诊治中如何更有效合理地使用DCE-MRI[J].临床放射学杂志,2024,43(09):1608-1611.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)