影像组学与机器学习在非小细胞肺癌淋巴结分期中的应用
2025-06-11 来源:放射学实践

作者:乔健一,李雅迪,王鹏远,辛军,中国医科大学附属盛京医院放射科

 

肺癌是最常见的癌症之一,非小细胞肺癌(non-small cell lung cancer, NSCLC)约占所有肺癌病例的85%。肺癌分期是评估肺癌患者的关键步骤。准确的肿瘤分期是为每位患者提供最佳治疗方案的基础。对于大多数肺癌患者来说,纵隔淋巴结的评估是肺癌评估的关键。

 

在缺乏远处转移证据的情况下,区域淋巴结的状态是指导治疗决策的的主要因素,纵隔镜和支气管内超声引导下经支气管针吸活检(endobronchial ultrasound-guided transbronchial needle aspiration, EBUS-TBNA)是评估纵隔淋巴结恶性程度最有效的诊断方法。但是作为侵入性手术,可能会出现并发症和假阴性结果。

 

影像学检查是目前非小细胞肺癌诊断和分期的重要手段,CT现广泛用于非小细胞肺癌的诊断,但CT仅提供病变的解剖信息,其对淋巴结转移的评估相对有限,PET/CT是一种同时提供解剖学和代谢信息的成像方式,与CT相比,该方法在肺癌淋巴结分期(N分期)方面表现出更好的性能,其敏感度为58%~94%,特异度为76%~96%。

 

低敏感度表明假阴性结果的可能性高,这可能是由于较小体积或代谢率低的病变中FDG摄取量较低。肉芽肿性感染和炎性病变累及淋巴结可导致PET假阳性结果。

 

近几年,深度学习的发展使得机器学习算法受到了人们的关注,机器学习是统计学和计算机科学的一门交叉学科,它专注于在大量的数据中进行学习,相比于传统的统计学方法,机器学习使得对疾病更准确的预测成为可能。

 

2012年影像组学的概念由荷兰学者Lambin提出,影像组学旨在从影像中提取高通量信息,实现肿瘤分割、特征提取与模型建立,凭借对海量影像数据信息进行更深层次的挖掘、预测和分析从而做出最准确的诊断。大量研究显示,影像组学在肺癌的诊断、分期、预后、疗效分析、基因突变、远处转移等方面已经取得一定成果。机器学习算法、影像组学均属于人工智能(artificial intelligence, AI)的范畴。

 

影像组学及机器学习算法通过对图像信息的挖掘,充分结合了原发病灶、瘤周组织和纵隔淋巴结的纹理信息以及患者的影像报告、临床资料进行数学模型的建立,并成功提高了医生对于非小细胞肺癌的淋巴结分期诊断水平,下面笔者将从影像组学和机器学习算法两个角度来探讨其在非小细胞肺癌淋巴结转移中的应用和价值。

 

1.机器学习在非小细胞肺癌淋巴结分期中的应用

 

1)机器学习的分类

 

机器学习分为监督学习和非监督学习,非监督学习更多地处理聚类和降维问题,所提供的数据未经过分类,监督学习主要处理分类和回归问题,输入的数据为有标签的分类数据,与肺癌N分期的机器学习方法多数是基于监督学习实现的。

 

深度学习属于监督学习中的一种,由于是一种模仿大脑的人工智能构架,因此称其为神经网络,其使用梯度下降优化方法在大型数据集上进行训练。通过深度学习,可以学习高度复杂的函数,它们能够在专门的计算硬件上运行,并随着更多的数据不断改进,使它们能够超越许多经典的机器学习方法。

 

2)经典机器学习在非小细胞肺癌淋巴结分期的应用

 

近些年来已经有许多研究把机器学习方法应用于预测肺癌淋巴结分期,其中多元逻辑回归算法应用最为广泛,因此笔者将经典机器学习方法分为多元逻辑回归和其他机器学习方法进行总结。

 

在非小细胞肺癌淋巴结分期的相关研究中,多元逻辑回归是最常用的模型。多元逻辑回归属于经典的机器学习方法,通过多元逻辑回归可以联合影像组学评分(radiomics score, Radscore)和临床资料绘制诺谟图,更加直观的反应预测结果。

 

Lv等对318名术前30天内行PET/CT扫描的患者进行回顾性研究,通过单因素及多因素逻辑回归方法筛选出肿瘤位置、肿瘤大小、淋巴结短轴大小、肿瘤最大标准摄取值(max standardized uptake value, SUVmax)和淋巴结SUVmax五个特征,再基于对数似然比方法,将癌胚抗原(carcinoembryonic antigen, CEA)也纳入回归分析,构建诺谟图,以预测患者的淋巴结转移情况,结果显示训练组ROC曲线下面积(area under curve, AUC)为0.858,验证组AUC为0.749。

 

Zhang等则利用SEER数据库中的35138例患者的临床信息通过逻辑回归模型进行分析,然后构造并验证诺谟图,结果内部验证队列及外部验证队列的AUC分别为0.696、0.693,因此,单纯的临床信息构建的多元逻辑回归模型性能比较有限。多元逻辑回归对于分类问题,尤其是二分类问题(比如是否存在淋巴结转移)方面具有较好的预测效果,虽然逻辑回归模型已被广泛应用于医学模型建立,但其不能很好地处理大量多类特征或变量,且可能出现欠拟合、精度不高等的问题。

 

除了多元逻辑回归之外,一些文章也使用了支持向量机(support vector machine, SVM),随机森林、k近邻算法等机器学习算法。Hu等进行了1524例非小细胞肺癌患者的回顾性研究,排除重复和无用变量,并选择16个候选变量进行进一步分析,采用随机森林(random forest, RF)算法和广义线性(generalized linear, GL)算法分别筛选出对淋巴结转移预测影响较大的变量,比较RF模型和GL模型的AUC,结果RF模型显示出了更好的预测效果,AUC值分别为0.83和0.64。

 

Yin等评估了71例患者的219个淋巴结,构建六种SVM模型,预测淋巴结的良恶性,其中包含SURblood L/S的模型拥有最好的性能。并且通过特征加权构建了更直观的临床预测模型(score>3.0为倾向恶性,1.5~3.0怀疑转移,<1.5倾向良性)。Yoo等对1329例肺癌患者的纵隔淋巴结进行研究,研究使用了梯度增强决策树、逻辑回归、支持向量机、神经网络和决策森林5种机器学习方法,最终得出梯度增强决策树表现最佳(AUC=0.850),且高于医生诊断(AUC=0.755)。

 

综上所述,除了多元逻辑回归,还有许多经典机器学习方法可用于非小细胞肺癌淋巴结分期,比如支持向量机在解决高维数据、小样本、非线性模式识别问题中具有优势,能够有效解决有限数量样本的高维模型构造;随机森林算法融合了不同集成方式,在实际应用中适合大量处理数据,存在较强的泛化能力,有较强的计算效率。不同的机器学习方法具有各自的优点和局限性,需要根据实际需求和数据的特点进行模型选择。

 

3)深度学习在非小细胞肺癌淋巴结分期的应用

 

深度学习是机器学习的一个分支,是最先进的机器学习方法。深度学习在许多模式识别应用中已经取得成功,深度学习或人工智能,可以为医疗保健带来革命性的变化。虽然深度学习几年来研究的热度较高,但在非小细胞肺癌淋巴结分期上的研究相对较少。Zhao等提出了一种结合了3D DenseNet和临床特征,以准确评估T1期肺腺癌中淋巴结转移风险的深度学习模型DensePriNet。

 

利用DensePriNet模型对501例患者进行深度学习,建立淋巴结转移预测模型,结果AUC为0.926,显著高于逻辑回归整合模型(0.904)、单一深度学习模型(0.880)和影像组学方法(0.891)。Tau等将263例中的223例可定义N分期的病例及全部263例可定义M分期的病例的PET图像纳入研究,通过5倍交叉验证,利用卷积神经网络进行训练,结果显示,该模型预测淋巴结阳性的敏感度、特异度和准确率分别为0.74±0.32、0.84±0.16和0.80±0.17,预测远处转移的相应值为0.45±0.08、0.79±0.06和0.63±0.05。上述研究证明了深度学习在预测肺癌淋巴结分期方面有较高的优势和价值。

 

Wallis等回顾性分析了134例患者的18F-FDG PET/CT 图像,U-Net进行自动分割,使用3D卷积神经网络预测淋巴结的良恶性,根据这些预测,可以确定病理性纵隔淋巴结。在第一个扫描仪的测试集上,模型实现了0.87(95%CI:0.74~0.94)的敏感度,每名患者的假阳性为0.41(95%CI:0.22~0.71),这与专家的表现相当。

 

在没有迁移学习的情况下,在第二个扫描仪的测试集上,对应的结果分别为0.53(95%CI:0.35~0.70)和0.24(0.10~0.49)。通过迁移学习后,这些指标分别为0.88(95%CI:0.73~0.97)和0.69(95%CI:0.43~1.04)。可见,相比于经典机器学习,深度学习凭借其更复杂的模型,可以在大样本学习中获得更好的模型效果,深度学习不仅用于病变的诊断,同时也可以进行病灶的自动分割(如U-Net模型),从而提高诊断效率。

 

2.影像组学在非小细胞肺癌淋巴结分期中的应用

 

1)影像组学步骤

 

影像组学步骤包括图像采集、图像分割、特征提取、特征筛选、模型建立和验证。其中图像分割是影像组学中最关键、最具挑战性和最具争议的部分,特征提取是影像组学的核心步骤(获取高维度特征数据)。目前主要通过提取分析肺癌原发灶、纵隔及肺门淋巴结或瘤周组织的影像组学信息来预测肺癌N分期。

 

2)通过原发灶的影像组学预测非小细胞肺癌淋巴结分期

 

目前影像组学在肺癌淋巴结分期相关研究中,较多数是基于肺癌的原发病灶。Yang等纳入159名符合条件的实体肺腺癌患者。从静脉期CT图像中提取影像组学特征。使用多元逻辑回归模型结合CT报告的淋巴结状态建立了影像组学诺谟图,结果显示:影像组学诺谟图预测两组淋巴结转移的AUC分别为0.871和0.856。

 

Zheng等对716名于手术前行18FDG-PET/CT检查且临床病理诊断为非小细胞肺癌的患者进行回顾性研究,从原发肿瘤的PET/CT图像中提取影像组学特征,使用支持向量机和随机树构建预测模型,并与临床N分期的预测结果进行对比,结果显示:训练组和测试组的随机模型对阳性淋巴结的预测性能(AUC为0.81和0.766,敏感度为0.794和0.688,特异度均为0.704)均明显优于临床淋巴结分期(训练组及测试组AUC均为0.685,敏感度为0.804和0.795,特异度均为0.568)。

 

He等回顾分析了717例术前两周内接受了胸部CT增强扫描的患者,其中277名患者在手术前接受了PET/CT检查,选择这些患者进行亚组分析。结果显示组学预测模型比临床模型有更好的预测能力,亚组模型预测能力也高于增强CT、PET/CT及临床模型。

 

部分研究以预测隐匿性转移为目的,在肺癌淋巴结转移的患者中,影像学上一般将淋巴结短径大于1 cm, PET图像SUVmax大于2.5的淋巴结作为阳性淋巴结,隐匿性淋巴结转移是指影像学上淋巴结为阴性而病理证实存在淋巴结转移的情况,虽然PET/CT已经有较高的敏感度和特异度,有研究报道PET/CT上隐匿性淋巴结转移(occult lymph node metastasis, OLM)的发生率高达14.3%~23.1%。因此,需要一种新的方法来提高临床N0患者OLM的诊断准确性。

 

Yang等基于CT的影像组学特征预测临床I期肺癌患者N2分期风险的模型,以两组接受肺切除的临床I期肺腺癌患者的数据集作为研究对象,利用筛选后的的5个组学特征进行预测模型建立,并与临床及混合模型进行比较,结果表明影像组学特征显示出比临床因素更好的预测性能,影像组学特征和综合模型之间的预测性能差异无统计学意义。

 

Zhong等对492例术前行增强CT的患者进行影像组学分析,通过主成分分析将筛选后的特征转化为非线性相关的特征,并且取得权重最高的四个特征[Kurtosis、S(0,5)InvDfMom、135dr_GLevNonU 、Area_S(1,1)],用SVM进行二分类取得了极好的效果,结果显示AUC为0.972,敏感度、特异度分别为94.8%、92.0%。Liu等对187例临床N0型周围型肺腺癌患者术前CT扫描进行组学分析,特征筛选出1个语义特征(胸膜凹陷征),1个组学特征(F185),两者混合模型(AUC=0.758)较语义模型(AUC=0.659)有明显改善,但与单独组学模型相比差异无统计学意义。

 

Wang等回顾性分析370例经病理证实的cN0肺腺癌患者术前18F-FDG PET图像进行组学特征提取,并记录患者的临床资料,经过最小绝对值收敛和选择算子算法(least absolute shrinkage and selection operator, LASSO)回归和多元逻辑回归分析等方法得出CEA、MTV和影像组学特征(由4个纹理特征线性组合而成)是预测OLM的重要独立危险因素,以此建立的诺谟图模型具有较好的性能:训练集C指数为0.769,和验证集C指数为0.768。

 

由于部分患者纵隔内淋巴结较小或者边界不清楚,导致淋巴结难以勾画,并且勾画者容易遗漏可疑淋巴结,造成漏诊。肺癌原发灶中存在更丰富的纹理信息,研究证明肺癌的原发病灶PET代谢参数(MTV,TLG等)及纹理特征对纵隔淋巴结的预测具有价值。纵隔淋巴结阴性的患者,原发灶的组学研究为临床寻找隐匿性淋巴结转移提供了思路。

 

3)通过纵隔内及肺门淋巴结影像组学预测淋巴结良恶性

 

影像学作为一种无创性检查方法,现已成为纵隔淋巴结术前分期的主要手段,但是由于肉眼所见的图像信息有限,且受到诊断医生主观影响,造成一定的误诊率,目前一些针对纵隔淋巴结的影像组学研究证明,影像组学可以作为一种有效的诊断工具,一定程度上弥补了以上方法的不足。

 

Dong等将129名患者中经病理证实的201个纵隔淋巴结静脉期增强CT纳入研究,使用多元逻辑回归分析筛选的8个组学特征进行影像组学评分,同时使用了其他五种机器学习模型,包括支持向量机、K近邻算法、随机森林、决策树和朴素贝叶斯等模型,最终发现多元逻辑回归模型和支持向量机的诊断效率最高,AUC分别为0.850,0.853。

 

Sha等以86例非小细胞癌患者的231个经病理结果证实的纵隔淋巴结作为研究对象,用多元逻辑回归方法利用组学特征构建了6个模型:1~3分别为平扫期间、动脉期、静脉期,4~6为平扫+动脉期、平扫+静脉期、动脉期+静脉期,结果显示,模型1~3有更高的AUC值,但模型4~6有更高的敏感度及阴性预测值。

 

Xie等对124例术前接受过PET/CT扫描的NCSLC患者中经病理证实的263个淋巴结进行回顾性分析,结果提示结合Radscore和SUVmax的综合模型int-score拥有更好的诊断效能(AUC=0.8)。上述研究说明,如果淋巴结在图像上能够清楚显示,且需要对纵隔淋巴结进行良恶性判断时,淋巴结本身的组学特征可以起到较好的预测作用。

 

4)通过肺癌原发灶瘤周影像组学预测肺癌淋巴结分期

 

目前多数肺癌的组学研究是基于肺癌原发灶进行的,而研究发现,肿瘤浸润和转移时,原发肿瘤周围的肺实质会发生变化。因此瘤周微环境可用于临床评估肿瘤侵袭性生物学行为,肺癌瘤周组织的影像组学分析在肺癌诊断、淋巴结转移、远处转移、侵袭性及预后评估方面均有应用,研究表明,瘤周结合瘤内影像组学对非小细胞肺癌淋巴结转移有较好的预测效果,而较少研究单独利用瘤周组学进行组学分析。

 

Wang等对366例临床分期为T1期的周围型肺腺癌患者CT图像进行研究,CT上的两个感兴趣体积(volume of interest, VOI)被定义为肿瘤总体积(GTV)和瘤周体积(PTV,肿瘤周围1.5 cm),研究拟构建三个影像组学特征GTV、PTV及两个组学特征联合(GPTV),GTV和GPTV使用mRMR和LASSO分类器得到AUC最高的组学特征,PTV直接通过LASSO分类器得到AUC最高的组学特征,最后用逻辑回归分析将五个参数和GPTV做为独立预测因子绘制诺谟图,其AUC为0.862。

 

Das等对163例临床分期为CT1N0M0的患者CT图像的GTV、PTV、LN(淋巴结)、GTPV(GTV+PTV)、GPTV LN(GTPV+LN)进行组学分析,最终使用两个临床特征(毛刺和CEA水平)和两个放射特征(GPTV和LN)构建诺谟图,结果显示内外部验证队列的AUC均为0.79。关于肺癌瘤周组织的影像组学研究还处于早期阶段,但现有研究已经证实其临床价值及应用前景。

 

3.机器学习和影像组学临床应用价值及在新技术上的应用

 

纵隔镜和EBUS-TBNA是目前肺癌术前淋巴结分期最有效的手段。然而,这些方法是侵入性的,可能会导致一些并发症的发生,因此并不作为常规推荐。影像学检查是临床医生评估纵隔淋巴结转移的重要手段,但是仅仅依赖于医生的主观判断,会造成一定概率的误诊。机器学习和影像组学模型是一种无创的工具,并且可以通过机器学习模型定量分析预测患者的淋巴结转移情况,有研究也证实了机器学习模型诊断效果可以高于影像科医生,因此影像组学和机器学习模型可辅助医生诊断,提高诊断的效率及准确率。

 

除了直接评估纵隔淋巴结的良恶性,影像组学还可以用于预测非小细胞肺癌的隐匿性淋巴结转移,对于影像学表现为纵隔淋巴结阴性的患者,通过提取肺癌原发灶的组学特征,构建影像组学模型,其结果对于隐匿性淋巴结转移的风险预测具有一定价值,有益于指导临床治疗及预后的评估。此外,U-Net深度学习模型可用于纵隔淋巴结的自动分割,相比手动分割,U-Net提高了分割的准确性和效率,并且可以帮医生快速定位可疑淋巴结。

 

MRI在非小细胞发淋巴结分期的相关研究相对较少,近期一项研究表明基于磁共振超短回波时间(ultra short echo time, UTE)序列的影像组学模型可以用于评估NSCLC患者淋巴结是否发生转移,有望为相关临床诊疗提供新的参考。

 

核医学(SPECT/CT,PET/CT,PET/MRI)成像目前也应用于肺癌淋巴结分期,尤其是18F-FDG PET/CT可以提供解剖学和葡萄糖代谢信息,诊断纵隔淋巴结转移的敏感度和特异度高于CT,目前已广泛应用于临床,相关的影像组学和机器学习研究在前文提及。研究表明,68Ga-FAPI PET/CT和99mTc-3PRGD2 SPECT/CT等使用新型药物的核医学检查也对肺癌患者淋巴结评估具有较高的价值,但因大多未在临床广泛开展,有待进一步研究。

 

4.展望与小结

 

机器学习和影像组学方法目前已经广泛应用于非小细胞肺癌的诊断与分期,相比于传统的影像学和统计学分析,影像组学方法能够获得更多肉眼不能识别的图像数据,而机器学习方法则能够提供更加精准的预测模型,为临床肿瘤评估提供了一种新的非侵入性手段。机器学习和影像组学方法在肺癌淋巴结分期的研究虽然已经取得了不错的成果,但仍存在一定的局限性:比如样本量小,图像缺乏标准化,缺少外部验证,图像分割存在主观差异,可重复性差等,这些问题有待后续研究进一步完善。

 

来源:乔健一,李雅迪,王鹏远,等.影像组学与机器学习在非小细胞肺癌淋巴结分期中的应用[J].放射学实践,2024,39(03):421-426.


(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)

0
收藏 分享