医学影像人工智能在预测肝细胞癌微血管侵犯中的研究
2025-09-17 来源:放射学实践

作者:刘洋,蒲红,四川省医学科学院·四川省人民医院放射科

 

原发性肝癌是常见的消化系统恶性肿瘤,是我国癌症新发病例数第5位,也是癌症死亡数量第2位。原发性肝癌的主要病理类型是肝细胞癌(hepatocellular carcinoma, HCC),约占75%~85%。随着靶向治疗及免疫药物的使用、手术技术的进步、综合诊疗方案的完善,肝癌患者的死亡率有逐年下降的趋势,但仍是我国第二位肿瘤致死病因。

 

HCC患者术后5年生存率低于20%,其重要原因之一在于肿瘤在被发现时往往处于晚期,可能已经出现微血管侵犯(microvascular invasion, MVI),导致术后有着高复发率。MVI的发生率可达到15%~57%,HCC出现MVI提示肿瘤具有侵袭性,存在较大转移风险,被认为是HCC术后早期复发和远期生存率的独立预测因素。

 

MVI又称微血管瘤栓,是指显微镜下才可以发现的癌细胞巢团,位于内皮细胞衬覆的微血管腔内,多见于癌旁组织内的门静脉小分支。MVI阳性患者不建议进行肝移植和射频消融术。然而,MVI的确诊通常依靠术后组织病理学检查,这不利于临床治疗决策和术后生存,因而术前更高效的预测方法对指导手术和提高生存率具有重要临床意义。

 

人工智能(artificial intelligence, AI)是一个“模糊概念”,它于1956年被确立成为一门学科,当应用在医学影像中可理解为通过正确地解释、学习影像学图片,从而客观的分析和评估疾病情况,具有灵活适应性。医学影像分析方面人工智能中最常用到机器学习技术,它可以分为无监督的学习和有监督的学习,比较流行的包括随机森林、支持向量机(support vector machines, SVM)与人工神经网络等。

 

深度学习(deep learning, DL)是属于机器学习的一类方法,大多基于特定类型的人工神经网络,具有大量的层和节点,从而完成特征提取和转换。这是一项新兴的技术,广泛认为2011年和2012年卷积神经网络(convolutional neural networks, CNN)在计算机视觉和成像应用完成真正的突破,随着计算机性能的快速发展和可获得数据的海量增长,深度学习有着巨大的潜力。

 

传统的影像组学(radiomics, R)是在非深度学习技术的辅助下高通量提取定量的、理想化可再现的信息的工具,通常基于手动构建的特征提取器,与自动提取特征的深度学习技术相比,一定程度上会受到主观因素的影响。基于MVI状态是二分类变量的特性,多数研究在建模方法选择方面应用了逻辑回归和主流分析方法如最小绝对收缩和选择算法(least absolute shrinkage and selection operator, LASSO)、SVM和CNN等。

 

截至2023年2月,我们通过检索共获得73篇基于CT和MRI影像使用人工智能技术进行术前预测HCC MVI的研究论著和7篇系统综述及荟萃分析,文章以英文为主。所有的研究均采用回顾性分析,部分纳入了前瞻性研究和外部验证队列。

 

通常数据集会被随机分为训练集和验证集,前者用于训练模型,试图从数据间获得复杂关系,后者用于测试模型的效能,模型的AUC、敏感度、特异性、准确度、阳性预测值、阴性预测值等指标可以用于评估比较。多数研究仅使用内部验证,少数研究纳入了外部验证。多数研究为单中心研究,少数使用了多中心数据。本文系统地回顾了医学影像AI技术在术前预测HCC MVI的研究,主要集中在CT和MR的影像,旨在发掘该领域所面临的挑战和机遇。

 

1.影像组学

 

影像组学最早在2012年得到正式框架描述,并广泛应用在医学影像的多个领域。影像组学的基本原理在于医学图像包含肿瘤表型的特征,这些特征在一定层面可以反映出潜在的病理生理状态,主要涵盖图像获取、感兴趣区域(region of interest, ROI)勾画、特征提取和预测模型构建4个关键步骤。Zheng等使用影像组学技术对预测HCC MVI做出初步探索,发现结合AFP、肿瘤大小、肝炎状态的影像组学模型预测MVI效能不错(AUC为0.88)。

 

有学者对32篇相关的影像组学研究文献进行了荟萃分析,结果显示合并敏感度、特异度和AUC值分别为0.81、0.82和0.89,体现出影像组学在术前预测肝细胞癌MVI中具有一定价值。而另一篇荟萃分析将术前预测HCC MVI使用的影像组学和非影像组学方法进行比较,结果显示影像组学的敏感度、特异度和AUC值分别为0.78、0.78和0.86 ,非影像组学方法的敏感度、特异度和AUC值为0.73、0.82和0.86,影像组学方法仅在敏感度方面表现略胜一筹。两篇文献分析的结果有待进一步验证。

 

2.深度学习

 

深度学习技术在医学影像中快速发展并广泛应用如图像处理、自动/半自动勾画ROI等,取得了不错的成果。Cucchetti等对使用构建的模型预测术前肝癌肿瘤分级和MVI做出了初步探索,对比传统的逻辑回归模型,发现结合临床特征和影像学特征构建的DL模型能更好地识别MVI和做出肿瘤分级(测试队列AUC为0.92)。深度学习技术可以应用在影像组学的任何阶段,如在图像预处理阶段进行ROI自动分割,在特征提取阶段提取深度特征,以及构建DL特征模型等,大部分研究都显示出深度学习技术的加入使得传统影像组学呈现了更佳的效果,AUC波动在0.742~0.931。

 

深度学习技术用于特征提取有独特优势,浅层学习的特征能关注详细的结构信息,而深层学习的特征更关注全局信息。Sun等利用CNN从MRI多个序列中提取特征并作融合,结果显示结合甲胎蛋白(alpha-fetoprotein, AFP)含量的组学模型显示出了良好的准确性(AUC:0.824)。

 

深度学习构建预测模型往往需要更大的数据量,Jiang等对比了基于405例术前CT的影像组学模型(基于XGBoost)和深度学习模型(基于3D CNN),发现DL模型在预测MVI方面更有优势(AUC:0.887 vs. 0.906)。

 

Wang等利用397人的CT和MRI信息对比了传统影像组学(基于SVM)和深度学习(基于ResNet18)模型的性能,结果发现基于MRI的DL模型优于影像组学模型(AUC:0.794 vs. 0.766,NRI>0,IDI<0),而基于CT的两者没有明显差异(AUC:0.742 vs. 0.710,NRI<0,IDI<0)。Wang等提出一种端到端的深度学习策略:MVI-Mind,集成了从数据预处理、自动分割、特征提取到MVI预测的全程,预测效能超越当前主流模型,AUC达到0.922。

 

然而不同于上述深度学习技术显示的优越性,一项荟萃分析的亚组分析显示使用深度学习方法与非深度学习方法构建模型预测肝细胞癌MVI,二者的敏感度和特异度无明显差异,这可能与该荟萃分析纳入的研究量较少有关。深度学习算法由于其自身特性,需要大量数据进行支撑,其可解释性也有所欠缺。

 

为解决这些问题,Xiao等提出了一种基于专家启发的模型,结果显示其增强了深度学习模型构建过程中的可解释优势,更符合医学逻辑。迁移学习等方法可以利用问题域中视觉特征的相似性解决大量训练数据需求的局限性。目前深度学习还不能完全取代影像组学,主要还是受到海量数据的限制。与影像组学相比,深度学习能够大幅提高模型的准确性,但是需要大量的训练数据作为支撑,这使得一些小样本的单中心研究不能进行或不能获得稳定的可泛化的模型。

 

3.多模态模型、多参数模型

 

大部分研究基于CT或MR成像的一种,每次成像又可分为不同的时期,MRI的多种序列,以及不同的对比剂类型都可能会对模型构建产生影响。多数研究结果显示利用MRI影像组学预测MVI是可行的,但是不同研究支持的组学特征和对应的序列存在差异,且重现性较差。Nebbia等研究了多参数MRI序列,发现单独序列里T2WI和门静脉期的影像组学模型结果更优(验证队列AUC分别为0.808和0.792),而多个序列的融合模型效能都会增高,其中T2WI和门静脉期的融合模型效能最佳(验证队列AUC:0.867)。

 

构建单模态模型可能产生较好的结果,但会失去其他模态的重要信息,而无论是构建单模态模型还是多模态模型的研究,达到更高的预测性能才是目的。对于小样本、单中心的研究,我们也期望个体的多模态影像可能存在信息互补,从而提供更多的有效信息,缓解小样本的负面影响。

 

研究认为基于CT和MRI的影像组学诊断性能基本相等。而在结合CT和MRI方面,Deng等发现基于小样本的双分支(结合CT和MRI)多模态贡献感知Trip Net模型优于其他深度神经网络或单分支(CT或MRI)模型(AUC:0.83),为小样本深度学习和多种成像模式融合等场景提供了潜在的解决方案。Wang等、Sun等的研究结果与之一致。

 

4.影像模型与临床模型

 

多数研究结果显示基于影像特征的影像组学模型比基于临床特征的临床模型预测MVI效能更高,如Peng等证明了影像组学模型在预测MVI方面优于基于动脉期瘤周增强、肿瘤边缘和肝胆期的瘤周低信号的模型。多项研究表明AFP、APTT、中性粒细胞-淋巴细胞比率(NLR)、肝转氨酶等检验指标,肿瘤边缘、肿瘤大小、不完全包膜、瘤内出血、瘤周增强、HBP瘤周低信号等形态学特征与MVI阳性风险存在相关性,但基于的研究人群不同,是否存在相关性在不同研究中是不一致的,我们将这部分内容归纳为临床特征和影像(形态学)特征,与基于定量特征的影像组学相鉴别。

 

其中,AFP和肿瘤大小是最常用于构建临床模型或融合模型的特征。Huang等的一项荟萃分析显示影像组学与非影像组学方法在术前预测HCC无明显差异,仅在敏感性方面略高(0.78对比0.13),但考虑影像组学具有量化特征的客观性、更高的一致性,研究认为影像组学有更好的预测效果。

 

与单一模型相比,联合临床指标、形态学特征的影像组学模型大多显示出更好的效果。Zhang等将基于Gd-EOB-DTPA增强MRI的临床影像模型、影像组学模型、临床影像-影像组学联合模型进行比较,发现联合模型的预测效果最好(AUC:训练和验证队列分别为0.824和0.802,前瞻性验证和外部队列验证中分别为0.812和0.805),优于临床影像模型(AUC:训练和验证队列分别为0.793和0.701),单纯基于影像组学特征的模型效果不佳。

 

另一项研究在基于增强CT延迟期的双中心研究中构建了预测MVI状态和MVI分期的两类影像组学模型,结果显示结合年龄、AFP水平的融合模型均获得最优效能(AUC:训练、测试和验证队列分别为0.806、0.803和0.796)。Song等的基于601例增强MRI的研究中显示结合临床参数的DL模型具有优越的预测性(AUC为0.931),优于单独的影像组学模型和DL模型(AUC为0.915和0.731)。但有部分研究却未显示出融合模型的优越性。Meng等的一项双中心研究结合临床、形态学特征的影像组学模型与基于临床特征的模型相比无统计学意义上的改善。一项荟萃分析纳入了22项相关研究,也认为结合临床危险因素的影像组学并没有提高诊断力。

 

5.ROI的选择

 

目前尚无统一的标准规范ROI勾画范围,多数研究通常在肿瘤外缘进行外扩(多为10 mm),从而进一步提高预测效能。ROI的勾画有手动、自动和半自动之分,通常需要覆盖肿瘤和/或肿瘤边缘的影像。多数研究表明肿瘤边缘与邻近肝实质之间的像素变化差异是最具有预测性的特征,这在影像图片上往往表现为瘤周低密度影、肿瘤边缘毛糙和/或动脉期瘤周增强等,这种肝脏-肿瘤交界部分可能反映出MVI、细胞增殖、炎症反应和细胞外基质重塑等潜在原因。

 

较宽的切缘切除或解剖切除,可以提高总生存期或无复发生存期。当勾画瘤周边缘ROI时通常需要选择更宽的切缘,使用自动勾画可能因纳入肝外区域而影响结果,现在也有技术可以帮助进行识别和排除,关于最佳的切缘大小值得进一步研究。部分研究表明从肝脏肿瘤区域提取的影像组学特征也与MVI相关。一些研究者对比了基于肿瘤特征与肿瘤边缘特征预测MVI的效果。

 

Nebbia等使用多参数增强MRI中肿瘤边缘、肿瘤以及两者结合的ROI用于特征提取和模型构建,发现肿瘤边缘与肿瘤结合的影像组学模型性能相对下降,这可能提示肿瘤和肿瘤边缘的信息不互补。但Tian等对≤3 cm的孤立肝细胞癌进行研究,结果显示基于融合序列的肿瘤+瘤周的影像组学模型表现最好,Hu等的结果与此一致,并且发现肿瘤边缘外扩20 mm(与10 mm和0 mm对比)诊断更准确。两者相矛盾的可能原因在于两项试验人群的HCC大小不一致以及ROI勾画方式不同。

 

6.总结与展望

 

使用人工智能技术构建的预测模型可以根据临床需要进行调整,例如当调整为高阴性预测率时,预测MVI阴性将支持肝脏移植而不是肿瘤切除手术,当调整为高阳性预测率时,预测MVI阳性将支持肝脏移植外的其他治疗方法。这意味着影像学模型有潜力成为肝脏移植的风险分层指标之一,优化肝脏移植的患者的选择,缓解低供体数量的压力。同时,模型预测的高风险MVI可以指导临床调整个体化治疗方案,如前期经动脉化疗栓塞,然后经手术切除肿瘤,从而获得更好的治疗。

 

总之,人工智能技术可以准确地根据术前影像资料预测HCC术前MVI。但是,基于影像组学的研究存在的不足也不容忽视。目前大部分研究是回顾性研究,难以避免选择偏倚和信息偏倚,数据多来自单中心,难以满足构建模型的需要,特别是深度学习模型,以及多数研究严格的排除标准也限制了研究的可重复性和可比性,因此需要更大规模的、多中心的、前瞻性的研究,纳入更广泛的患者特征,增加结果的独立有效性,使得成果具有可推广性。除此以外,ROI的规范性问题需要解决,期待更准确的自动分割技术。

 

综上所述,医学影像人工智能对于预测肝细胞癌微血管侵犯有着独特的优势,值得更加深入的研究。未来研究更应该重视其前瞻性、多中心、高质量,证明基于人工智能的预测模型的诊断价值。

 

来源:刘洋,蒲红.医学影像人工智能在预测肝细胞癌微血管侵犯中的研究[J].放射学实践,2024,39(06):830-834.


(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)

0
收藏 分享