作者:俞越,浙江中医药大学第二临床医学院;
肺癌是目前全球最常见的癌症,也是癌症死亡的第一大原因。在我国,肺癌发病率和死亡率一直居高不下。肺癌可分为小细胞肺癌(small cell lungcancer,SCLS)和
近年来,免疫治疗在晚期NSCLC 治疗中应用逐渐增多,主要通过增加肿瘤特异性T 细胞的浸润、阻止肿瘤对T 细胞功能的抑制等机制,激活或增强机体对肿瘤的免疫反应。其中,免疫检查点抑制剂(immune checkpoint inhibitor,ICI)治疗是目前研究最深入、成效最显著的免疫治疗方法。无论是局部晚期NSCLC 放化疗后免疫治疗,还是转移性NSCLC 的一线和二线治疗,ICI 都能显著改善NSCLC 病人预后。但部分病人会产生免疫相关不良反应,甚至出现病情恶化。因此,精准识别免疫治疗潜在获益人群是关键性问题。
根据生物学标志物(包括组织病理学、分子病理学、血液学指标等),加上病人病史及临床特征等辅助预测信息,可对免疫治疗疗效及病人预后进行预测。目前,临床应用最广泛的ICI 疗效预测指标为程序性细胞死亡配体1(programmed cell death ligand 1,PD-L1)和肿瘤突变负荷(tumor mutational burden,TMB)。基于CT 影像构建的人工智能(artificial intelligence,AI)模型具有预测PD-L1 表达水平和TMB 的能力,不仅可以避免有创性活检,还能减少肿瘤异质性带来的影响。
AI 技术的应用促进了影像数据的分析和利用,机器学习(machine learning,ML)作为AI 的分支,可以利用计算机从数据中学习并做出决策;深度学习(deep learning,DL)是ML 的子领域,主要基于人工神经网络来模拟人脑处理信息。随着AI 在肺癌诊疗中的应用增加,基于CT 影像的AI 模型在晚期NSCLC 免疫治疗中的应用也在不断深入。
1. AI 模型在晚期NSCLC 疗效和预后预测中的应用
目前,临床试验中常用无进展生存期(progression free survival,PFS)和总生存期(overall survival,OS)对肿瘤预后进行评估。实体瘤疗效评价标准(response evaluation criteria in solid tumor,RECIST)作为最常用的评估肿瘤治疗反应的标准之一,主要关注靶病灶长径的变化,而忽略肿瘤密度、体积、形态等其他方面的变化,未考虑肿瘤内部的异质性,与实际情况存在偏差。
由于RECIST 评估流程没有关注免疫治疗的非典型反应模式,因此有研究者提出了实体瘤免疫疗效评价标准(immune-related response evaluation criteria in solid tumor, iRECIST)等以免疫疗效为基础的评价标准,但也同样存在上述局限性。AI 模型的发展与应用为晚期NSCLC 免疫治疗疗效及预后预测提供了新思路。
1.1 基于CT 影像的AI 预测模型
基于免疫治疗前基线CT 影像构建的模型可以预测晚期NSCLC病人的免疫治疗疗效和预后。Jazieh 等基于不可切除的Ⅲ期NSCLC 病人免疫治疗前基线CT,勾画肿瘤区域并提取瘤内和瘤周纹理特征,利用最小绝对收缩和选择算子(LASSO)Cox 回归模型选择特征并构建影像组学风险评分模型,该模型将病人分为高风险组和低风险组,对PFS 具有较高的分层能力和预测效能。
Wu 等提出一种多视图自适应加权图卷积网络(graph convolutional network,GCN)模型,将从多种类型的原始影像或滤波影像中提取的影像组学特征看作为多个视图,并引入自注意力机制,自动为每个视图分配权重,用于构建多视图GCN分类模型,对晚期NSCLC 病人免疫治疗疗效有较好的预测效能(AUC 为0.778)和准确度(77.27%)。此外,治疗前后CT 影像的影像组学特征的动态变化对于晚期NSCLC 病人免疫治疗的疗效和预后也有预测价值。
Khorrami 等纳入139 例晚期NSCLC 病人ICI 治疗前和治疗2~3 个周期后的CT影像,提取肿瘤内部及周围的影像组学特征,分析治疗前后影像组学特征的变化并生成Delta-影像组学特征集,构建的ML 模型对晚期NSCLC 病人ICI治疗反应的预测效能较高(AUC 为0.88)。Gong 等的研究基于晚期NSCLC 病人ICI 治疗前后的CT 影像分别提取基线CT 影像组学特征和Delta-影像组学特征,并分别构建ML 分类模型进行ICI 治疗反应预测,结果发现相比基于基线CT 影像的预测模型(验证集AUC=0.52),Delta-影像组学模型的预测效能显著提高(验证集AUC=0.87)。
Trebeschi 等基于152 例晚期NSCLC 病人ICI 治疗的903 次随访胸部CT 影像,利用卷积神经网络(convolutional neuralnetwork,CNN)提取CT 影像中肿瘤和非肿瘤区域与预后相关的形态学变化信息,并构建了一个DL 预测模型,该模型对ICI 治疗后病人预后的预测效能较好(AUC 最高为0.75)。
治疗前后影像组学特征的动态变化,相较于仅基于基线CT 影像提取的特征,提供了肿瘤在免疫治疗过程中形态或纹理变化的额外信息,能更好地预测病人的治疗反应,其潜在的生物学机制可能与肿瘤生长动态以及肿瘤内部异质性变化有关,特别是肿瘤微环境的变化,如血管生成、炎症反应、免疫细胞数量与分布变化以及肿瘤细胞的代谢变化等。
综上所述,基于CT 影像的AI 预测模型可以精准识别肿瘤的时空异质性,能够提取关键信息来预测晚期NSCLC 免疫治疗疗效和预后,基于不同影像资料以及不同建模方法的预测模型在疗效和预后预测方面都表现出良好的效能。
1.2 基于多模态数据的AI 预测模型
尽管基于CT 影像的AI 预测模型在特定领域表现良好,但临床诊疗产生的数据类型多样,基于单一模态数据的预测模型对疾病的考量有限。因此,多模态融合模型应运而生,尤其在晚期NSCLC 免疫治疗反应预测的研究中得到广泛应用。将临床特征纳入AI 预测模型中,有利于提高模型效能。在各类数据中,人口学特征、肿瘤分期和转移情况、实验室检查、治疗信息等临床文本数据是最易获取的。
有研究基于免疫治疗前基线CT提取影像组学特征,构建了预测ⅢB-Ⅳ期NSCLC病人PD-L1 表达且能够预测PFS 的CNN 模型,使用多个临床特征构建了临床预测模型,并将2 个模型结合构建融合模型,结果显示融合模型在免疫治疗反应预测中表现出更强的预测效能。另有研究基于CT 影像构建的DL 模型也能够较好地预测免疫治疗的OS,证实合理整合临床特征和影像组学特征可以提高模型预测效能。
Saad 等收集了Ⅳ期NSCLC 病人免疫治疗的多模态数据,基于基线CT 影像构建了1 个包含4个三维CNN 的集成DL 模型,同时利用人口学特征、影像学特征、病理特征、治疗特征构建了1 个ML 基准模型,最后将两者整合为复合模型;在测试集中,集成DL 模型对OS 和PFS 的预测风险比(HR)分别为2.29 和1.94,而复合模型对OS 和PFS的预测HR 提升至4.65 和3.23,表明复合模型在预后预测效能上有显著提升。该研究采用集成DL 方法来整合潜在互补的CNN 结构,降低了单一网络模型的不确定性,增加了模型的泛化能力。
Vanguri等基于晚期NSCLC 病人的基线CT、数字化PDL1免疫组化切片以及二代测序数据,分别构建了影像组学模型、病理学模型以及基因组学模型,然后通过DL 方法整合多模态数据构建融合模型,结果发现融合模型的预测效能(AUC 为0.80)高于上述3 种单模态模型(AUC 分别为0.65、0.62 和0.61)。
由此可知将CT 影像、组织病理切片和临床二代测序结果等多模态数据相结合构建多模态融合模型,可以提升免疫治疗反应的预测效能。然而,多模态数据整合的难点在于技术实现的复杂性和较高的成本,这使得整个整合过程颇具挑战性。尽管如此,整合多模态数据仍是优化免疫治疗预测模型的不可或缺的关键环节。
2. AI 模型在免疫相关
ICI 为肿瘤病人提供临床获益的同时,也会引起免疫相关不良事件(immune-related adverse event,irAE),如皮炎、肺炎、
Tohidinezhad等的研究纳入556 例Ⅳ期NSCLC 免疫治疗病人,从发现肺炎表现时的CT 影像中提取和筛选影像组学特征并构建ML 模型,该模型鉴别诊断免疫治疗引起的肺炎和其他类型肺炎的阴性预测值和阳性预测值分别为80%和79%。Chen 等利用NSCLC 病人胸部增强CT 影像中肿瘤的影像组学特征,结合PD-L1 蛋白编码基因CD274 的RNA 表达水平构建复合预测模型,该模型能够预测肺炎的发生,但预测效能一般(AUC=0.64)。
Zhang 等纳入接受ICI治疗的晚期NSCLC 病人,基于基线CT 提取影像组学特征,联合临床特征及影像学语义特征,采用ML方法构建预测模型,可以准确预测免疫相关性肺炎,在训练集和验证集的AUC 分别为0.903 和0.826。
目前基于CT 影像的AI 模型在irAE 方面的研究多集中于免疫相关性肺炎的识别与预测,利用CT 影像预测其他免疫相关不良事件有待进一步研究。晚期NSCLC 免疫治疗的超进展是指在接受免疫治疗期间出现肿瘤病灶加速生长的现象,与生存期的缩短相关。其作为NSCLC 免疫治疗的非典型反应模式,较为少见,但明显影响病人的预后,因此准确预测超进展的发生同样关键。
Vaidya 等从接受免疫治疗的晚期NSCLC 病人的基线CT 影像中提取肿瘤及其周围区域的影像组学特征,并结合肿瘤相关脉管系统的特征建立随机森林分类器模型,该模型在训练集和验证集的诊断效能均较高(AUC分别为0.85 和0.96),可以较为准确地识别肿瘤的超进展。该模型预测的超进展者和非超进展者之间的OS 存在显著差异(HR=2.66,95%CI:1.27~5.55),提示超进展者比非超进展者具有更差的预后。
综上,基于基线CT 影像的预测模型可用于识别具有超进展风险的病人,有助于临床决策和治疗策略的调整。
3. 局限性与挑战
3.1 模态缺失
多模态融合模型具有预测晚期NSCLC 免疫治疗反应的研究潜力,但临床实际中的数据缺失问题不可避免。为解决该问题,目前常用策略包括忽略缺失数据的样本和数据插补。忽略缺失数据的样本,仅用完整数据进行训练,会减少样本量,影响模型效能;数据插补方法可能导致数据偏差和冗余,影响模型的泛化能力。
此外,采用子空间学习、知识蒸馏等方法能够提高模型的泛化能力,但可能无法充分获取缺失模态的信息。这些策略各有利弊,在实际应用中需要平衡数据完整性和模型效能。Chen 等的研究通过先解耦再知识蒸馏的方法处理医学影像中的模态缺失。Qian 等的研究采用跨模态对比学习与掩码注意力模型,获取模态间的交互信息而不引入额外噪声,解决了不完整多模态模型常见的引入噪声、灵活性不足以及未能关注模态间相互作用等问题。
总之,关于多模态模型模态缺失问题的研究具有重要的实践意义。
3.2 模型可解释性
尽管基于CT 影像的AI 模型在医学研究中取得了显著成果,但其在临床实践中的应用有限。由于预测模型的“黑盒”性质,使得模型的决策过程难以解释。目前,研究者们采用多种方法来提高模型的可解释性。在特征维度上,可通过改善特征的可视化、量化肿瘤的异质性、整合临床报告的语义特征等方法,得出特征与生物学意义之间的关联。
在模型维度上,可采用模型内在可解释性方法和事后解释方法。内在可解释性方法包括ML 方法中的线性回归、K-邻近、决策树等;DL方法中变换器(Transformer)模型利用自注意力机制能够突出重要的区域或特征,提供了一定程度的可解释性。事后解释方法能揭示模型预测原因和整体工作机制,包括特征重要性评估、模型简化和可视化等,可判断模型对特定特征或区域的敏感度。尽管存在多种解释技术,但模型可解释性仍需进一步研究,以增强透明度和可信度,推动其在临床实践中的应用。
4. 小结与展望
基于CT 影像的AI 预测模型在晚期NSCLC 免疫治疗领域应用广泛,其在评估疗效和预后、预测不良反应等方面的价值已被多项研究证实。结合影像学、临床和病理学方面的数据构建的多模态融合模型具有更优的效能,但模态缺失和模型可解释性问题亟待解决。因此,未来除了需要跨学科、多中心的合作,纳入更大样本、更多模态的数据外,同时也要加强医工交叉与合作,从而不断提升模型的效能、可解释性和泛化能力。此外,当前基于CT 影像的AI预测模型研究多以回顾性为主,未来可以开展更多的前瞻性研究,以进一步提升模型的可信度,为实现精准化、个性化的免疫治疗提供更优方案。
来源:俞越,石磊.基于CT影像的人工智能模型预测晚期非小细胞肺癌免疫治疗反应的研究进展[J].国际医学放射学杂志,2025,48(01):81-85.DOI:10.19300/j.2025.Z21517.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)