作者:褚晓彤,付宇,郑爽,何刊,
根据世界卫生组织国际癌症研究署(world health organization international agency for research on cancer, WHO/IARC)对全球癌症的统计数据显示,肝癌发病率位居恶性肿瘤的第6位,病死率位居第3位。在我国,
目前,我国肝癌5年生存率仅为11.7%~14.1%,降低肝癌根治性治疗后复发率、提高复发肝癌的早期诊断率是提高5年生存率的重要措施之一。影像学在原发性肝癌的监测、诊断、分期以及治疗后随访中起着关键作用,CT及动态增强扫描常应用于肝癌的临床诊断及分期,多参数MRI在对直径≤2.0 cm肝癌的检出和诊断,评估肝癌是否侵犯门静脉、肝静脉主干及其分支,以及腹腔或腹膜后间隙淋巴结转移方面具有优势,但由于肝癌危险因素和发病机制的广泛异质性,现有的术前预测分级和预后手段仍然十分有限。
随着数字化时代的到来,肝癌的诊断和治疗正在经历一场前所未有的生命科学革命,人工智能(artificial intelligence, AI)技术的快速发展在肝癌的个性化精准医疗方面发挥了重要作用。目前在医学影像学领域广泛应用的人工智能主要有两类,一类是传统的机器学习(machine learning, ML)算法,另一类是深度学习(deep learning, DL)算法。ML使用数字技术来整合计算、优化和统计的原理,并专注于探索模拟人类的学习机制。
DL是一种使用具有多个非线性处理单元的人工神经网络来学习数据的算法,主要使用深度神经网络(deep neural networks, DNN)进行模式识别。DL专注于研究如何在大数据环境下有效利用信息,从海量数据中获取隐藏的、有效的、可理解的知识。近年来,
1.肝脏及肿瘤分割
肝脏和肿瘤[包括
基于传统图像处理算法的各种计算机辅助
近年来,深度学习的发展极大地促进了医学图像的分割,卷积神经网络已经成功地应用于多种脏器及肿瘤的分割,在肝脏影像方面,深度学习在肝脏和肿瘤分割方面也取得了显著成就,有学者利用深度学习从
Perez等利用深度学习人工智能工具在3065例进行结直肠筛查(n=1960)或肾供体评估(n=1105)的患者CT图像中自动分割肝脏,确立肝脏体积并建立了肝脏肿大的阈值,得出该分割模型的Dice评分为0.887±0.006,提供了比线性测量更准确客观的肝脏体积评估手段。与整个肝脏的分割不同,肝脏局灶性病变的分割长期以来一直是一个难题,与肺部等其他器官不同,背景肝脏和局灶性肝脏病变的图像之间对比度较低,尽管对比剂的使用增加了图像对比度,但检测肝癌病灶的结构仍然很困难,深度学习技术在肝脏肿瘤分割领域逐渐受到关注,为自动分割肝脏肿瘤提供了新的可能。
2017年肝脏肿瘤分割挑战赛(liver tumor segmentation challenge, LiTS)中,研究者开发基于AI的算法在CT图像上自动分割肝脏肿瘤,采用Dice评分评估模型的分割准确度,在这场比赛中评分前十的模型均使用卷积神经网络(convolutional neural networks, CNN)方法分割肝脏肿瘤,其中效能最高的算法Dice评分为0.830。
近年来许多学者探索了新的改良算法自动分割肝脏肿瘤,Zhou等在U-net网络的skip-connection中添加了具有反卷积和激活操作的剩余路径提升了在CT图像中肝脏的分割精度,在LiTs挑战赛的数据集中验证该模型,得到其对肝脏肿瘤分割的Dice相似系数为89.72%;也有学者提出了一个基于残差块和扩张卷积的自动统一无配准的深度学习模型来训练端对端的肝脏病变分割模型,在LiTS数据集中得到肝脏病灶的Dice评分为86.7%;Zheng等建立了一种基于3D卷积和卷积长短期记忆 (c-lstm)的4维(4D)深度学习模型,在MRI增强图像对HCC病灶进行分割,具体来说,该研究设计了一种基于浅U-net的三维CNN模块用于提取增强图像各期的三维空间特征,另外设计了一个4层C-LSTM网络模块,用于提取增强各期的时域信息,该模型分割肝脏肿瘤的Dice系数为0.825±0.077。
由此可见,人工智能方法在对肝脏和肝脏肿瘤的分割中展现出了较好的效能,但要将这些算法从工作台带到临床应用场景,还需要对模型的准确性、精确度、速度进行更严格的评估及改进。
2.肝癌诊断及组织学分级
人工智能方法在肝癌诊断方面的研究多集中在对肝脏肿块的良恶性鉴别及肝癌的分级方面,基于CNN的深度学习方法在图像的模式识别方面越来越受到关注。CNN由卷积层、汇聚层、非线性层和完全连接层等一系列层组成,其中居于核心地位的卷积层对图像用不同的滤波器进行处理,可以有效识别图像模式。相比需要在学习之前从图像中提取特征的传统机器学习方法,卷积层的应用允许CNN在学习过程中使用图像本身,从而使基于CNN的深度学习能够应用图像中包含的所有信息。
Yasaka等建立了基于CNN的深度学习模型,探究其在增强CT图像上区分肝脏肿块的效能,将肝脏肿块分为五类:A类为典型肝癌,B类为非典型和早期肝癌,C类为不确定肿块和肿块样病变,D类为
有研究建立了基于T2WI、DWI的影像组学模型对肝细胞癌与肝富血供良性病变进行鉴别,发现与临床预测模型、影像组学模型相比,诺模图模型具有较高的诊断性能,在训练集、测试集中的AUC分别为0.988、0.955,且该模型的诊断效能显著高于影像医师(分别为0.808和0.780)。
另有学者研究了CNN模型在多时相MRI图像上对肝脏肿块的分类性能,对494个常见六种肝脏病变(囊肿、血管瘤、HCC、肝内胆管细胞癌、肝脏局灶性结节增生、
相关临床研究表明肝癌预后较差,易复发,一般而言,病理分级越高的HCC,术后复发率越高,患者生存期越短,因此准确预测肝癌的病理分级对于制定治疗策略至关重要。根据临床指南,针吸活检是恶性肿瘤术前评估的常规方法,但由于其存在并发症及样本错误的风险,因此不建议用于诊断肝癌。
在医学图像上评估肝癌分级对放射科医生来说也是一项具有挑战性的工作,人工智能的出现为通过医学成像方法非侵入性地预测肝癌病理分级提供了新的思路。有学者回顾性地从297例肝癌患者的增强CT图像中提取影像组学特征以建立对肝癌病理分级的预测模型,模型的AUC为0.801,该研究表明基于机器学习的增强CT影像组学分析可以提高预测模型的准确性,并且可以非侵入性地探索HCC的图像与病理分级之间的潜在关联,但该研究仅利用了增强CT数据,并未在多模态组学模型上探索。
Zhou等将挤压-激励网络与三维密度链接卷积网络相结合,开发了一种新的深度神经网络分析来自两个中心的增强MRI图像,对肝癌进行分级,得到该网络的精确度为83%;Li等提出了一种基于深度学习架构的注意力引导的判别自适应融合方法,在增强MRI图像中对肝癌进行分级,在2D图像(AUC=0.881)及3D(AUC=0.927)图像上均获得良好效果,并且与其他已有研究相比,此模型效能最高。
3.评估肝癌微血管浸润
据报道,MVI是肝癌治疗后2年内早期复发的主要风险因素。目前MVI大多通过术后的组织病理学进行诊断,这可能会影响术前制定合理的治疗方案。近期研究表明,某些成像方式在预测MVI方面具有很大的潜力。一些影像学特征,如非光滑肿瘤边缘、动脉期瘤周强化、肿瘤MRI低信号和肝胆期(hepatobiliary phase, HBP)图像上的瘤周低信号等,是MVI预测的非侵入性成像生物标志物,然而这些定性特征由于观察者间的不可重复性和缺乏外部验证在预测MVI方面具有局限性。影像组学可以对图像进行高通量挖掘和定量分析。
有学者将临床特征、影像特征和增强CT影像组学特征相结合,建立MVI的术前预测模型,在测试集中得到该模型的AUC值为0.889;Nebbia等研究了利用多参数MRI影像组学来预测术前MVI状态,从5个MRI序列(T1WI、T2WI、DWI、动脉晚期和门静脉期图像)图像的肿瘤区域和瘤周区域提取影像组学特征,建立了单独序列与联合序列模型,比较他们对MVI的预测效能,单独应用时T2WI的预测效能最好(AUC为 0.810),结合使用时T2WI和门静脉期结合效果最好(AUC为0.870)。
有学者利用基于增强MRI影像组学方法对MVI进行术前预测,从增强MRI动脉期(arterial phase, AP)、门静脉期(portal venous phase, PVP)及延迟期(delay period, DP)图像提取特征,构建基于AP、PVP、DP及基于3期特征融合的影像组学模型和临床因素预测模型,得出增强MRI影像组学模型中3期联合模型与临床影像特征结合建立的临床影像组学模型的诊断效能最高,训练组与测试组AUC值分别为0.934、0.911,表明基于增强MRI建立的临床影像组学模型能够在术前无创地评估和预测MVI。
另有研究利用133例肝癌患者的术前钆剂增强MRI图像建立了针对MVI预测的单任务和针对MVI和包裹肿瘤簇的血管(vessels encapsulating tumor clusters, VETC)同时预测的3D CNN深度学习模型,单独预测MVI的3D CNN模型的AUC为0.896,同时预测MVI和VETC的多任务3D CNN模型的AUC值为0.917,该研究发现此模型在评估VETC状态的同时可以提高MVI预测的性能,另外还发现这种联合预测可以对HCC患者的预后进行分层,并在根治性切除术前实现个性化预测。
Xia等从经病理证实的肝癌患者的门脉期CT图像中提取了肝癌肿瘤和瘤周区域的影像学特征,与临床影像学特征相结合建立混合模型术前预测MVI,结果显示模型在内部测试集和外部测试集的AUC分别为0.860和0.840,该研究利用TCIA公开数据集中35例患者的RNA测序数据进行基因分析,发现MVI阳性患者的差异表达基因通常与糖代谢有关。
4.预测肝癌治疗后疗效和预后
在治疗前有效预测肝癌患者的治疗反应及预后对制定肝癌个体化治疗方案有重要意义,人工智能方法在术前预测肝癌的疗效方面具有巨大潜力。2018年Akai等在127例患者的术前CT图像中提取影像组学特征对患者肝癌切除术后的总生存期进行了有效预测。
有学者利用来自3家医疗机构的789例接受经动脉化疗栓塞术(transcatheter arterial chemoembolization, TACE)的肝癌患者的术前CT图像,训练并验证了在术前预测中晚期肝癌患者接受TACE后反应的深度学习模型,在训练集中该模型对完全反应(complete response, CR)、部分反应(partial response, PR)、稳定疾病(stable disease, SD)和进展疾病(progressive disease, PD)的预测准确率为84.3%,AUC分别为0.970、0.960、0.950和0.960;在另外两个验证集中,深度学习模型对CR、PR、SD和PD的预测准确率分别为85.1%和82.8%。
另有研究探索了采用深度学习方法建立术前预测经TACE联合索拉菲尼治疗的肝癌患者的总生存期,研究者利用多中心的201例患者的术前CT图像的深度学习特征联合临床特征建模,得到患者的中位总生存期为19.2个月,模型的C指数在训练组和验证组分别为0.717和0.714。
有学者探究了MRI扩散加权成像联合外周血CD4+/CD8+比值预测CalliSpheres载药微球栓塞介入治疗晚期肝癌疗效的价值,结果显示ADC值、外周血CD4+/CD8+比值及两者联合预测治疗后疗效的AUC分别为0.876、0.824和0.918。
近年来,免疫治疗作为新兴热点广受关注,Chen等从免疫治疗前钆塞酸增强MRI图像中提取影像组学特征,建立了瘤内影像组学模型、瘤周-瘤内影像组学模型、临床-影像组学联合模型等3种免疫评分预测模型,结果显示临床-影像组学联合模型的AUC(0.926)高于其他两种模型(AUC分别为0.823、0.904)。另有学者运用机器学习方法构建模型,预测接受免疫治疗的晚期肝癌患者1年内的癌症相关死亡率,其AUC值达到了0.920。
近年来,也有许多学者对采用影像组学和人工智能方法无创性地预测肝癌术后复发进行了探索。Kim等研究了在肝癌切除术前预测患者术后的早期复发(≤2年)和晚期复发(>2年),从167例接受手术切除且经病理证实为肝癌的2~5cm单发病灶中提取MRI组学特征,利用随机生存森林方法建立影像组学模型、临床病理学模型和临床病理学-影像组学联合模型,结果显示临床病理学-影像组学模型的预测效能最高,对无病生存的预测精度达0.716。
另有研究从来自双中心接受肝癌切除术的286例经病理证实为HCC的术前
由此可见,人工智能方法在预测不同肝癌疗法的疗效及预后方面均表现出良好的效果,可以帮助临床医生更好地对肝癌患者进行治疗的受益评估,有利于制定患者的个性化治疗方案。
5.现存挑战及未来展望
在肝癌的诊治过程中,影像手段发挥着不可替代的重要作用。人工智能和影像组学技术可以提高对原发性肝癌的诊断和鉴别诊断效能,帮助预测肝癌的分期、组织学分级、MVI、治疗反应和预后等,有望成为术前制定个性化治疗决策的有力工具,但目前仍然存在局限性和诸多挑战:
首先,深度学习需要大量的高质量数据才能训练出准确的模型,现有研究的分割模型仅来自一个或者几个机构的数据,在新的数据上应用时可能遭受泛化问题,另外目前在MRI图像上进行肝脏肿瘤自动分割的研究相对较少,未来这一方面尚待学者们进一步探索;
其次,目前对于肝脏肿瘤标注质量控制的共识较少,已有研究在肝脏局灶性病变的标注标准方面提出了初步指导意见,帮助构建鲁棒性好、泛化能力强的肝脏AI算法模型,随着肝脏AI研究的不断深入,标注的标准也将进一步规范;
最后,现有研究的训练集和测试集数据尺度不一,数据量普遍较小,并且大多数依赖回顾性数据建模,因此未来需要前瞻性大样本研究进行开发和验证。相信随着技术的进步和研究的进展,人工智能在肝癌的诊疗中必将发挥更加重要甚至不可替代的作用,从而促进精准医疗的进步。
来源:褚晓彤,付宇,郑爽,等.人工智能在原发性肝癌影像学的机遇和挑战[J].放射学实践,2024,39(09):1244-1249.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)