作者:王艳艳,吴华伟,上海交通大学医学院附属仁济医院放射科
IPF具有异质性高、进展快且不可逆的特点,中位生存期仅3~5 年,早期诊断和提早治疗至关重要。IPF的诊断需要多学科专家讨论,综合考虑环境暴露史、临床病史、实验室资料、影像检查、
在适当的临床背景下,如排除结缔组织病、环境暴露等原因所致的其他ILD,HRCT 表现为UIP 型或很可能UIP型可以避免有创的外科肺活检。然而,放射科医生对HRCT 的视觉评估常存在显著的观察者间和观察者内变异性、主观性以及相对较低的敏感度,因此计算机辅助检测(computer-aided detection, CAD)应运而生。
CAD 能够自动、可靠地分析成像数据,并提供决策支持,从而提高诊断的准确性。近年来,随着人工智能(artificial intelligence,AI),特别是深度学习(deep learning,DL)的兴起,AI 在CAD 各个环节中的应用日益广泛,促使影像生物标志物在疾病诊断和预后评估中的应用进入了迅速发展阶段。本文就AI 在IPF 诊断、疾病进展与预后预测以及药物治疗反应评估中的应用进展予以综述。
1. AI 概述
作为计算机科学的一个分支,AI 能够模拟并延伸人的思维,在医学影像领域中已广泛应用,尤其在CAD 中的应用。AI 技术结合CAD 可以显著提高阅片医生的诊断效能并降低误诊率。机器学习(machine learning,ML)是AI 的一个分支,其使用算法解析训练数据,从中自动学习数据的模式和规律,完成特定任务。
ML 包括有监督学习和无监督学习,其技术范围从简单的线性模型逐渐发展到具有大量参数的复杂神经网络。人工神经网络由多层神经元组成,每个神经元代表一种特定的激励函数,模拟人类大脑不断处理输入数据,并通过加权处理直到达到输出层。DL 是ML 的一种特殊形式,以人工神经网络为基础,可以有效识别不同模式的高维数据(如医学成像中的体素),并将其用于诊断、评估疾病等。
DL 相较于传统ML 的一个显著优势是不需要手动提取特征,而直接从图像数据中自动学习特征,包括人眼无法识别的特征,并且可以自动优化模型。此外,DL 可以从数据中学习高层次的抽象特征,这些特征不易被ML 识别,因此DL 在处理复杂数据中常具备更高的模型效能。
卷积神经网络(convolutional neural network,CNN)是目前DL 中应用最广泛的一种算法,由卷积层、池化层和全连接层构成,通过反向传播算法调整网络内部参数,自动且自适应地学习空间层次上的特征。
2. AI 在IPF 中的应用
2.1 诊断
准确且早期地诊断IPF 对于及时开始抗纤维化治疗至关重要,因为早期抗纤维化治疗有助于减缓呼吸功能下降及预防急性加重。此外,IPF 和其他ILD 有明显不同的预后和治疗选择,这进一步强调了正确诊断的重要性。胸部X 线检查使用广泛且辐射剂量相对较低,常作为ILD 病人的初筛检查方法。
Nishikiori 等构建了一种基于深度CNN 的诊断模型,用于自动识别胸部X 线检查中的慢性纤维化间质性肺炎,该模型的诊断效能略优于放射科医生,提高了胸部X 线片对ILD 的检出能力。相比于胸部X 线检查,HRCT 具有更高的敏感性,对IPF 的诊断发挥着关键作用。根据2022 国际IPF 诊断指南,IPF 病人的HRCT 表现分为4 类:UIP、很可能UIP、不确定UIP 及其他诊断。UIP 和很可能UIP 无需进行肺活检。
Walsh 等采用基于Inception-ResNet-v2 的DL 框架,根据2011 年美国胸科学会(ATS)/欧洲呼吸学会(ERS)/日本呼吸学会(JRS)/拉丁美洲胸科学会(ALAT)标准和2018 年Fleischner 协会标准对肺纤维化疾病的HRCT 影像进行自动病理分类,结果显示,该模型的诊断准确度优于大多数的胸部放射科医生,算法效能接近于医生水平。
Christe 等结合HRCT 影像和临床信息,构建了基于ML 的CAD 系统,对肺纤维化病人的CT 影像进行自动四分类,该模型的诊断准确度接近放射科医生。然而,上述2 个模型的参考标准均为放射科医生的判读,而非组织病理学结果。
Shaish等以组织病理学作为参考标准,开发了一个CNN算法,该算法以HRCT 影像上4 cm×4 cm×2 cm 的外周肺虚拟楔形切除作为输入,预测HRCT 上的UIP模式,结果表明该算法的AUC 达74%,与组织病理学结果呈中度一致(κ=0.41),近似于医生水平(κ=0.40)。
此外,Bratt 等同样以组织病理学为参考标准,纳入了来自多个中心的1 239 例经病理证实的ILD 病人,并开发了一个自定义的DL 模型,用于基于CT 成像模式预测组织病理学诊断(UIP 与非UIP),研究显示该模型AUC 为0.87,优于经验丰富的放射科医生(AUC 为0.8),并且相较于视觉评估具有更好的重现性。与单独使用ML 或DL 相比,将传统的ML 和DL 相结合可以显著提高模型效能。
Refaee 等比较了基于ML 进行手动特征提取的影像组学模型和DL 模型,以及两者的联合模型在区分IPF 和非IPF中的潜力,结果显示联合模型的效能最佳,其准确度分别为76.1%、77.9%、85.3%,AUC 分别为0.817、0.823、0.917。最近的一项研究报道了一种基于两阶段的模型,用于自动诊断CT 影像上的IPF。第一阶段采用多尺度、领域知识引导注意力模型;第二阶段则使用随机森林(random forest,RF)分类器对第一阶段的输出进行处理。这一方法不仅避免了ML 的特征标注及DL 的黑盒现象,还提高了DL 模型的准确性和可解释性。
2.2 预测疾病进展与预后
IPF 通常进展缓慢,可呈急性加重,预后差,因此及时、准确预测疾病进展并进行治疗干预尤为重要。用力肺活量(forced vital capacity,FVC)、肺
HRCT 亦是评估IPF 进展与预后的重要影像方法,可以识别不同肺区域的疾病程
VRS 是ILD 病人死亡率和预后的独立预测因子,并且与肺功能有良好的相关性。Jacob等研究发现,在IPF 病人的纵向随访中,VRS 评分在病变范围不广泛的病人中对预后的预测优于肺功能,并且VRS 评分>4.4%用作IPF 药物试验人群的筛选指标,可使招募人群规模减少25%。肺纤维化体积是由磨玻璃影、网状影和蜂窝影相加所得。Sverzellati 等报道在病情稳定>2 年的IPF 病人中,随访1 年时基于CALIPER 的肺纤维化体积增加不少于20%是预测预后的最佳指标,C 统计量为0.62;而随访2 年时VRS≥20%是最佳预测指标,C统计量为0.59。
通过结合FVC 指标,两者对预后的预测能力均得到了提高,C 统计量分别为0.69、0.65。Koo 等首次研究发现,CALIPER 软件的效能不会因为CT 剂量减少而降低。Chung 等在影像学或组织学特征共同表现为UIP 的结缔组织疾病相关间质性肺病(connective tissue disease-related interstitial lung disease,CTD-ILD)和IPF 病人中进行CALIPER的定量特征分析,多因素分析显示VRS与IPF 独立相关,与CTD-ILD 不相关,表明VRS 在区分CTD-ILD 和IPF 上可能有一定价值。
数据驱动纹理分析(data-driven texture analysis,DTA)是一种利用无监督ML 开发的计算机算法,能自动量化CT 影像上的肺纤维化程度。Humphries等评估了IPF 病人的DTA 评分与基线以及随访15 个月的肺功能(FVC、肺一氧化碳弥散量)和视觉评估之间的相关性,结果显示DTA 评分与基线肺功能呈中度负相关,与基线视觉评估呈中度正相关;同时,还与两者随时间的变化相关,研究表明DTA评分能够反映疾病严重程度并监测疾病进展。
Humphries 等进一步评价了DTA 评分的效能特征,在原有肺功能基础上加入了6 min 步行试验、呼吸系统疾病相关的生活质量问卷,结果再次证实了DTA 与肺功能之间的良好相关性,确认了DTA 的信度、效度和反应度,并估计了DTA 监测IPF 进展的最小临床重要差异值。此外,更大规模、更长随访时间的队列研究表明DTA 评分是无移植和无进展生存的独立预测因子。
除了肺纤维化程度,
Si-Mohamed 等利用DL 自动量化CT 影像中的肺容积,研究发现肺CT 容积与FVC、总肺活量之间存在很强的相关性(r 分别为0.86、0.84);并且随着时间变化,IPF 人群的肺CT 容积损失较其他ILD 人群更大、更快。此外,IPF 病人的肺CT 容积损失量与预后显著相关。
Nam 等利用DL 软件量化CT 影像中的肺纤维化程度,并进行多变量Cox 回归分析,结果发现CT 中正常肺组织和肺纤维化容积百分比是IPF 病人总生存率的独立预测因子,同时可作为肺功能试验的替代或补充生物标志物。UIP 的预后明显差于非UIP。系统性客观纤维化成像分析算法(systematic objective fibrotic imaging analysis algorithm, SOFIA)是一种基于Inception -ResNet-v2 的深度CNN,可以自动识别HRCT 影像中的UIP 样特征,并依据诊断指南的CT 四大分类输出每个分类的概率。
相较于单一指南的四分类,SOFIA 对HRCT 特征进行更严格、细致的评估,即使在HRCT 表现为替代诊断的情况下,仍能识别出背景中的UIP 特征。Walsh 等将SOFIA 输出的UIP 概率转换为基于肺栓塞诊断前瞻性研究(prospective investigation of pulmonary embolism diagnosis, PIOPED)的UIP 概率,并使用多变量分析评估其在IPF 和非IPF 人群中的预后能力。
该研究发现,即使病人的HRCT 表现为不确定UIP,基于SOFIA-PIOPED 的UIP 概率仍是上述两类人群死亡率的独立预测因子,而基于放射科医生评估的UIP概率和诊断指南的CT 类别不是死亡率的独立预测因子。
此外,Ali 等通过比较多种ML 算法对IPF 疾病严重程度进行预测,选择了效能最佳的3 个ML算法,并基于这3 个算法开发了软投票集成模型,该模型准确度为0.71,精确度为0.64,召回率为0.71,F1 值为0.66,均优于单一的ML 算法,该模型对早期识别IPF 恶化并开展治疗有较好的应用价值。
Shi 等开发了一种新型包装算法,将量子粒子群优化和RF 算法相结合,通过纹理特征对IPF病人基线HRCT 中感兴趣区的所有体素进行二分类(进展、不进展),从而预测感兴趣区在6~12 个月随访中的疾病进展,该模型准确度为82.1%,敏感度为81.8%,特异度为82.2%。在Shi 等研究基础上,Kim 等将该模型从小的感兴趣区扩展到全肺,生成基线HRCT 单扫描总概率评分,结果显示该评分与定量的肺纤维化程度具有较好的相关性,而与肺功能无明显相关性。
Pan等利用无监督ML 识别与IPF 疾病进展相关的新型CT 特征模式,研究发现这些特征可以预测病人预后;此外,该研究还探索了从健康到患病肺组织的CT 模式转换路径,或有助于了解IPF 疾病的潜在机制。
2.3 评估药物治疗反应
IPF 是特发性间质性肺炎(idiopathic interstitial pneumonia,IIP) 的常见亚型,对于CT 表现不典型的IPF 和其他非IPF 病人,目前可用的治疗方法很少,只有少数病人对
3.小结
综上所述,AI在IPF的诊断、疾病进展及预后预测以及治疗反应评估中具有很大的应用价值。然而,目前AI 在IPF 中的研究尚存在一些局限性:
(1)AI用于IPF 的进展与预后研究中,未使用阈值对AI 算法获得的相关肺纤维化参数进行分期,今后的研究可以对此进行充分探索。
(2)大多数研究都是回顾性研究,将来需要更多的随机对照试验和前瞻性试验去评估AI 工具在临床的实用性及稳定性。
(3)将不同AI 技术相结合开发混合算法也是将来研究的一大趋势。
(4)未来的AI 模型应是多模态的,算法训练的输入数据需要整合不同领域信息,包括肺功能、实验室资料、临床病史等,而非单独影像领域,由此模型的诊断和预后准确性可能会得到提高。
来源:王艳艳,吴华伟.人工智能在特发性肺纤维化中的研究进展[J].国际医学放射学杂志,2024,47(01):48-52.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)