作者:李富恺,刘建莉,兰州大学第二医院放射科
慢性肝病(chronic liver disease,CLD)是世界性公共卫生问题,每年造成约200万人死亡,严重危害人类健康。肝纤维化是各种CLD进展为肝硬化和肝癌的重要中间环节。研究发现,肝纤维化和早期肝硬化经过及时有效的治疗干预是可以维持、消退甚至逆转。早期肝纤维化以病因治疗和抗炎保肝治疗为主,进展期肝纤维化和肝硬化需要进行抗肝纤维化治疗。因此,准确客观地诊断并评估肝纤维化分期具有重要临床意义。
近年来,随着算力的提升、算法技术的突破和大数据时代的来临,以机器学习(machine learning ML)和深度学习(deep learning,DL)为代表的人工智能(artificial intelligence,AI)技术发展迅速,深刻改变着传统医疗方式,在疾病的诊断评估、治疗方案决策及预后护理康复等临床工作中起到了不可忽视的作用,为医生和患者带来了巨大便利。
利用AI自动分析医学图像和识别肉眼难以观察的病变的能力,能够有效帮助临床医生对疾病进行精准诊断,辅助制订个体化治疗方案。由于CLD的高患病率和高死亡率,加之缺乏足够精确的无创检查来取代肝活检,将AI技术应用于肝脏疾病的诊断和评估中意义重大。
近年来,AI分析肝纤维化影像图像的能力在临床上也得到了充分验证。相关研究表明AI通过各种机器算法,将影像图像转化为高保真度、高通量的可挖掘的数据特征,使定性诊断转变成了定量评估,这在一定程度上提高了肝纤维化分期的评估效能,但AI在肝纤维化影像诊断中的研究同时面临诸多挑战,包括影像数据标注任务艰巨、AI模型泛化性差等。
本文就AI在肝纤维化影像学[超声(ultrasound,US)、电子计算机断层扫描(computed tomography,CT)、MRI]中的研究进展进行综述,旨在介绍该领域AI发展现状并尝试分析当前面临的问题,以期为实现肝纤维化无创、精准评估及临床个体化精准医疗提供影像支持。
1. AI与肝纤维化影像学检查
肝穿刺活检是诊断肝纤维化的“金标准”,但其为有创性检查和潜在的严重并发症等缺点也显而易见,且不利于动态随访。常规影像检查(如US、CT、MRI)可以根据肝脏的形态学变化诊断和评估肝纤维化。但在肝纤维化的早期阶段,影像学特征不明显,不能准确地评估肝纤维化进展程度。
单一影像学检查进行评估只能得到有限的信息,总是会受到脂肪变性、坏死性炎症活动等影响。而大多数研究表明,AI技术不仅能提高医学影像学的图像质量,还能结合影像学检查更准确、客观地评价CLD的异质性改变,其诊断性能明显高于放射科医生,甚至不输于肝穿刺活检。AI为肝纤维化的非侵入性诊断提供了一种临床应用前景广阔的新技术。
1.1 AI与肝纤维化US检查
传统US检查具有无创伤、无痛苦、无辐射、价格便宜等特点,是目前广泛应用的肝脏检查方法之一。而在实际检查过程中,主要依赖临床医生的主观经验,通过观察US图像中回声的厚度,结合剪切波速度值来诊断肝纤维化的严重程度,诊断价值受限。而AI能够客观、准确地评估肝脏纹理改变,避免人为主观性的影响。有研究对236名患者762张灰阶US图像采用二维轮廓变换和纹理特征分析,结果显示评估肝纤维化分期的准确率达到91.54%。
超声弹性成像(ultrasound elastography,UE)利用了由特定病理或生理过程引起的软组织弹性变化以区分正常组织与肝纤维化组织,操作简便,可重复性好,目前广泛应用的是瞬态弹性成像(transient elastography,TE)和二维剪切波弹性成像(two-dimensional shear wave elastography,2D-SWE)。但UE易受到患者生理差异(呼吸、肥胖、怀孕等)和其他疾病(肝炎急性期、肝脏淤血等)的影响导致假阳性结果。
在AI技术广泛应用于医学图像分析的前提下,利用影像组学和DL方法提取图像特征,能极大地改善内外在因素对图像的影响,提高评估肝纤维化程度的准确率。LEE等基于TE图像构建深度卷积神经网络模型,该模型在预测Metavir评分的内部和外部测试集上的准确率分别为83.52%和76.43%,特别是在模拟US检查时,该模型的诊断性能[曲线下面积(area under the curve,AUC)为0.86]明显优于多名放射科医生(AUC为0.66~0.82)。
WANG等基于398名患者1 990张2D-SWE图像,构建了DL弹性成像影像组学(DL radiomics of elastography,DLRE)模型,研究表明DLRE对进展期肝纤维化和肝硬化的诊断与病理活检相似(≥F3、F4时的AUC分别为0.98、0.97)。2021年该团队进一步将TE图像、肝实质灰度图像和临床血清学指标融合,建立了DLRE 2.0模型,结果显示≥F2的AUC从0.88提高到0.91。
总之,基于多种US图像参数特征构建的AI模型对肝纤维化表现出较高的诊断效能。故AI的发展,可能为临床上早期准确评估肝纤维化的严重程度提供帮助,但基于不同US图像参数和不同AI算法构建的模型间性能差异有待进一步研究。
1.2 AI与肝纤维化CT检查
传统CT检查可观察肝脾的形态学和门静脉、脾静脉等内径的变化,可以定性诊断晚期肝纤维化和肝硬化,但难以对早期肝纤维化进行定量评估。CT灌注成像(computed tomography perfusion,CTP)是一种间接评估肝纤维化程度的方法,能够及时发现局部组织血流灌注量的改变。在肝纤维化疾病早期,传统CT并不能发现这些改变,而CTP在肝脏形态学尚未改变之前,就可准确发现血流动力学的变化。但CTP辐射剂量大,且图像质量受呼吸运动影响较大,不利于临床应用。
近年来,基于平扫CT或增强门静脉期CT图像,利用影像组学和DL技术诊断和评估肝纤维化的研究日益增多。既能准确评估肝纤维化严重程度,又只使用了传统CT,对比CTP显著降低了辐射剂量。
影像组学在图像纹理分析、影像学定量特征提取中充分突显高敏感检出、高维信息挖掘及高通量计算等能力,对肝纤维化进行准确诊断和评估。CUI等利用232名肝纤维化患者三期增强CT图像建立ML模型,发现在100例患者的外部验证中,肝纤维化的AUC介于0.65~0.80(区分F4和F3)和0.50~0.76(区分F3和F2)之间,优于传统的肝纤维化4因子(fibrosis4,FIB-4)指数。
同时,该研究分别构建了基于平扫期、动脉期和门静脉期CT图像的ML模型,结果显示单期ML模型与基于三期增强CT图像构建的ML模型在评估肝纤维化的分期方面没有显著差异。WANG等利用332名患者的增强CT图像构建了肝纤维化影像组学模型和临床影像组学融合模型,研究表明两种模型(Obuchowski指数分别为0.84和0.85)在评估肝纤维化各个分期方面的表现均明显优于天冬氨酸转氨酶和血小板比率指数(aspartate amino transferase and platelet ratio index,APRI)(Obuchowski指数为0.65)和FIB-4(Obuchowski指数为0.68)。
与影像组学不同,DL使用人工神经网络(artificial neural network,ANN)来模拟和学习人类大脑的工作方式,这使得它能够处理更复杂的模式识别问题。卷积神经网络(convolutional neural network,CNN)是一种特殊的ANN,它利用卷积运算来提取图像特征,可以更有效地捕捉图像中的空间结构信息。
有研究表明,基于CNN用于图像转换的DL模型可以提高不同CT协议、重建内核和CT扫描仪的影像组学特征的可重复性。CNN在肝纤维化诊断中的应用包括利用自动分割技术测量与肝纤维化相关的器官体积变化和在图像上直接评估器官形态变化。
SON等使用CNN测量了513例肝硬化患者和45例正常对照的肝脏体积和脾脏体积,发现肝脏体积/脾脏体积对晚期肝纤维化(F3)和早期肝硬化(F4)预测的AUC分别为0.84、0.91。基于CNN分割技术的器官体积评估在晚期肝纤维化的诊断中取得了一定程度的成功,但其在早期肝纤维化诊断中的诊断效能还不足。
CNN不仅分割特定的靶器官(如肝脏、脾脏),而且还捕捉整个腹部图像中与早期肝纤维化相关的微小变化。YIN等基于252例肝纤维化患者的增强CT图像构建肝纤维化分期网络模型,该模型诊断≥F2、≥F3和F4的AUC分别为0.92、0.89和0.88。此外,使用梯度加权类激活映射(gradient-weighted class activation mapping,Grad-cam)定位每个肝纤维化阶段肝纤维化分期网络活跃部位的研究发现,在早期肝纤维化时肝脏表面发现大量网络反应,而在晚期纤维化时网络反应更多地聚焦于肝实质和脾脏,这与传统的肝脏成像结果一致。2022年该团队进一步在肝脏影像组学特征的基础上增加了基于CT的脾脏影像组学特征,结果表明影像组学可以补充Grad-cam定位图,提高了肝纤维化分期的诊断性能。
总之,基于平扫CT、增强门静脉期CT或能谱CT构建的以影像组学和DL为代表的AI模型,在评估肝纤维化分期方面显示出了良好的诊断性能和广阔的应用前景。但是通过勾画感兴趣区(region of interest,ROI)对病变进行定量测值,测量范围有限,且受测试者的主观因素影响,试验可重复性不高。因此,下一步的研究可以采用全容积ROI法对全肝及肝分段功能状况进行定量评估,有望为肝纤维化的准确分期及进展预测提供更可靠的影像学依据。
1.3 AI与肝纤维化MRI检查
相对于US和CT,MRI具有无辐射,多方位、多参数、多序列成像等优点。每个序列均可以从不同方面反映肝脏组织和病变的内在特性,合理组合腹部扫描序列能为肝纤维化诊断提供更多有价值的信息。此外,MRI的高软组织分辨率也能更敏感地发现早期肝纤维化病理改变。磁共振弹性成像(magnetic resonance elastography,MRE)是目前评估肝纤维化准确性较高、稳定性较好的影像学检查手段之一。
MRE可以评估患者肝脏整体的纤维化情况,具有无创、无辐射、扫描速度快等优点,不受腹腔积液和肥胖影响。但MRE检查相对耗时,检查费用相对较高,限制了MRE的临床应用。AI技术结合MRI能更深入地挖掘和整合人眼无法发现的图像信息,更大程度地提取和筛选MRI图像特征,全面客观地评估肝纤维化。
WEI等收集了280名肝纤维化患者和48名健康志愿者的T1WI和T2WI压脂图像,首次将两个序列图像相结合构建影像组学模型,可以有效预测肝纤维化的分期。NOWAK等使用了两种CNN,分析了深度迁移学习方法如何在T2WI图像中识别肝硬化,其准确性可与两位放射科医生的评估结果相媲美。樊凤仙等基于224例肝纤维化患者的T1WI、T2WI和表观扩散系数图像构建了3D-CNN模型,研究结果表明,多模态MRI的3D-CNN模型对显著肝纤维化(≥F2)的诊断效能良好,在训练集和测试集的AUC值分别为0.94和0.98。
钆基对比剂(gadolinium-based contrast agents,GBCA)通过提高附近水质子在体内的弛豫率来提高身体内部结构的可见度,现已作为肝细胞特异性对比剂被广泛用于肝脏疾病的增强MRI检查。但多次进行相关检查会引起包括脑部钆沉积和肾源性系统纤维化等副作用,严重影响患者的健康。基于GBCA增强MRI的AI可以在保证图像质量的前提下极大地减少GBCA使用,实现对肝纤维化的低剂量检查和高效能评估。
PARK等基于钆塞酸二钠(gadolinium-ethoxybenzy-diethylenetriaminepentaacetic acid,Gd-EOB-DTPA)增强MRI肝胆期(hepatobiliary phase,HBP)图像,采用弹性网正则化的二元逻辑回归构建影像组学模型,通过计算影像组学纤维化指数(radiomics fibrosis index,RFI)来评估肝纤维化,结果显示RFI(Obuchowski指数为0.86)在评估纤维化分期方面显著优于标准化肝脏增强(Obuchowski指数为0.77)和血清学指标(APRI评分和FIB-4指数的Obuchowski指数分别为0.60、0.62)。
ZHENG等结合了动态对比增强MRI(dynamic contrast enhanced MRI,DCE-MRI)图像的成像特征和时域信息,构建了一种基于Gd-EOB-DTPA的DCE-MRI影像组学模型,结果表明,与传统的基于单相或多相DCE-MRI的影像组学模型及标准化肝脏增强和血清标志物(APRI、FIB-4)相比,该模型对肝纤维化所有阶段具有更优越的预测性能,能更精准对肝纤维化进行自动分期。
近年来,MRI-DL技术在自动分割肝脏后评估肝纤维化严重程度方面显示出良好的诊断性能。HECTORS等研究发现,基于Gd-EOB-DTPA增强HBP的DL算法在预测肝纤维化严重程度方面表现良好,各肝纤维化阶段的AUC为0.77~0.91,可用于对肝纤维化的无创评估,且与MRE具有相似的诊断性能。
STROTZER等使用了一种CNN来处理121名肝纤维化患者基于Gd-EOB-DTPA增强HBP图像,研究表明,U形卷积神经网络(U-Net)在分割肝脏和评估肝纤维化分期方面性能良好;在无纤维化或肝硬化的情况下,预测效果显著,而中度纤维化的预测率较低。下一步的研究可以利用3D U-Net进行肝脏分割,同时整合其他序列(如T2WI、DWI),进一步提高模型的评估性能。
基于Gd-EOB-DTPA增强HBP的影像组学分析可以准确诊断和分期肝纤维化,但应用钆双酸二葡胺(gadobenate-dimeglumine,Gd-BOPTA)增强HBP来区别肝纤维化的研究相对较少。ZHENG等根据102名慢性乙型肝炎患者的临床和影像学资料,构建了传统的临床影像学模型和融合了基于Gd-BOPTA增强HBP影像组学特征的综合模型,结果表明,综合模型(AUC为0.90)在诊断晚期肝纤维化(≥F3)的临床效能明显优于传统临床影像学模型(AUC为0.81)、FibroScan模型(AUC为0.73)和血清学模型(APRI和Fib-4的AUC分别为0.67、0.79)。
总之,基于钆对比剂增强HBP图像的影像组学和DL技术在肝纤维化分期方面具有良好的评估价值。目前的研究多采用单一序列、常规序列构建模型,未来要整合MRI多种特殊序列,发挥多序列、多模态MRI的优势,并且要完善MRI图像数据采集的标准化问题,需要更多的中心进行验证来提高模型的鲁棒性和泛化能力,进一步实现疾病的综合辅助诊断。
2. AI在肝纤维化评估中的挑战
目前,AI在肝纤维化诊断评估中应用较为广泛,相关研究也取得了一定成果。虽然有较大的发展前景,但同样面临诸多挑战:
(1)样本量的严重不足。一方面为了保护患者隐私,医院不能提供样本;另一方面医学影像相对复杂,想要得到能让机器正确学习的影像数据集,就必须要通过严格的数据收集、清洗、标注、验证、导出等步骤,工作量巨大。
(2)影像数据标注任务的艰巨。数据标注是ML和AI等领域的基础。医学影像的标注工作必须由具专业且权威的医生参与完成,并且需要对标注结果进行检查和比对,以确保标注的正确性和一致性,人工成本极高。
(3)模型泛化性差。由于数据的样本量不足、参数过多以及特征选择不当等原因,导致大多数AI模型在训练集上性能良好,而在外部验证时无法取得令人满意的结果。
(4)缺乏人文关怀。医生基于临床诊断作出的治疗干预,是融合了科学知识、临床经验和人文关怀的综合考量。医疗服务不仅仅是医学技术服务,更是医学技术加上医学人文所形成的完整服务。医生有效的人文关怀能提升患者的信心,增强患者应对挫折的能力,促进患者的康复,这正是当前的AI所缺乏的。
3.小结与展望
目前,肝组织病理学检查仍是鉴别和评估肝纤维化分期的金标准。AI模型在评估肝纤维化时不仅能同时关注肝脏和脾脏,还能关注晚期肝纤维化和肝硬化引起的并发症,帮助临床医生及时给予患者适合的治疗。虽然这些AI方法暂时无法取代肝活检,但它们优于其他非侵入性的替代方法,如APRI、FIB-4、TE和MRE等。
总而言之,以影像组学和DL为代表的AI对于肝纤维化具备良好的诊断能力,有望成为无创、客观、全面评估其严重程度的重要工具。作为一种新兴的医工交叉融合的产物,当前AI在医疗领域确实存在着前文提到的一些困难与挑战,需要进一步探索,以求实现影像数据的标准化和改善AI模型的泛化性。
下一步我们要积极与蛋白组学、代谢组学及基因组学等跨学科结合,深入到肝纤维化病理、分子甚至基因水平,针对肝纤维化的不同病因、不同病理状态及不同肝脏微环境等进行更详细的研究分析。未来随着越来越多大样本、多中心研究的开展,AI基于海量的临床资料和影像数据不断进行自我学习和升级改进,必将为肝纤维化的诊疗提供更有价值的影像信息,推进肝纤维化无创诊断技术的临床转化,推动个体化精准医疗的发展。
来源:李富恺,刘建莉.人工智能在肝纤维化影像学中的研究进展[J].磁共振成像,2024,15(02):219-223.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)