【综述】人工智能在呼吸罕见病诊疗中的应用和研究进展_

【综述】人工智能在呼吸罕见病诊疗中的应用和研究进展

发布时间：2026-01-25

作者：刘冰怡谢敏

第一作者单位：华中科技大学同济医学院附属同济医院急诊和危重症医学科

通信作者：谢敏，华中科技大学同济医学院附属同济医院急诊和危重症医学科

引用本文：刘冰怡, 谢敏. 人工智能在呼吸罕见病诊疗中的应用和研究进展[J]. 中华结核和呼吸杂志, 2026, 49(1): 78-83. DOI: 10.3760/cma.j.cn112147-20250728-00445.

摘要

呼吸罕见病是一类临床表现异质性强、诊疗复杂、病因多样的疾病，常因症状不典型与医生认知有限而被误诊或延误诊治，受此影响，患者预后常常不佳，医疗负担较为沉重。近年来，人工智能技术在医学领域的迅速发展为此类疾病的早期识别、精准诊断及个体化管理提供了新思路。从传统的机器学习到深度学习、强化学习、迁移学习等新兴方法，人工智能已在呼吸罕见病的临床辅助决策、影像组学分析、组学数据挖掘以及治疗反应预测等方面进行了尝试。本文系统梳理了人工智能在特发性肺纤维化、囊性纤维化、特发性肺动脉高压及其他罕见呼吸病种中的最新研究进展，结合代表性研究案例，阐释了人工智能在呼吸罕见病分型诊断、治疗评估与预后预测中的潜力与优势。

呼吸罕见病是指一系列发病率极低但病种繁多、病程复杂、诊疗难度高的呼吸系统疾病，包括特发性肺纤维化（idiopathic pulmonary fibrosis，IPF）、囊性纤维化（cystic fibrosis，CF）、肺泡蛋白沉积症（pulmonary alveolar proteinosis，PAP）等病种。这类疾病病因复杂且临床表现具有显著的异质性，常因缺乏特异性早期症状和临床认知不足导致误诊或漏诊，进而引发诊断延迟、错失治疗最佳时间窗等不良临床结局^{［1, 2］}。流行病学研究显示呼吸罕见病病患医疗资源消耗大，给公共卫生系统带来了持续而沉重的负担。然而，罕见病种类繁多患者分散，加之相关高质量临床数据匮乏，使得转化创新研发进展困难，目前罕见病精准诊疗与管理仍是当前医学界面临的重要挑战^{［3, 4］}。

随着信息化、智能化进程的不断加快，人工智能（artificial intelligence，AI）在医学领域已逐步从理论研究走向临床实际应用。人工智能具备强大的数据处理与建模能力，能够在大量医学数据中发现潜在规律，辅助疾病的精准诊断、个体化治疗以及患者管理。在罕见病此类传统方法难以高效应对的场景中，人工智能为实现呼吸罕见病管理提供了新的视角和手段。

一、人工智能技术简介

人工智能是一类通过模拟人类智能，通过输入大量数据通过不同的算法从数据中挖掘规律，从而实现智能化决策的技术。

1. 传统机器学习：人工智能在医疗领域的应用早期以传统机器学习为主。支持向量机、随机森林、梯度提升树等经典算法已经广泛应用于医学影像，实验室检查等多模态数据的分析，并在诊断，治疗，预后评估等领域得到了广泛的应用^{［5, 6］}。

2. 深度学习：近年来，深度学习作为机器学习的分支迅速崛起，其核心特征在于模拟人脑神经连接，通过多层神经网络结构对复杂数据进行特征提取和模型构建。深度学习领域目前已开发了多种经典模型。例如，卷积神经网络在医学影像识别分割中表现优异^［7］；循环神经网络在时序预测和序列分析上有较强表现，常应用于呼吸频率、脑电图等连续监测数据的分析^［8］；Transformer架构以自注意力技术为核心，突破了传统神经网络对长距离依赖建模的限制，成为当前主流模型的基石算法，在医学领域展现出了广阔的应用前景。

与此同时，大语言模型和视觉语言模型如GPT、DeepSeek的出现进一步拓宽了人工智能在医疗中的应用场景。这类模型基于Transformer架构，通过对大规模文本的学习，实现了强大的语言理解和生成能力，在临床诊断，患者管理等领域已有多项应用，展现了颠覆性的潜力^{［9, 10］}。

此外，强化学习、迁移学习、多任务学习等前沿方法也正被引入医疗研究与实践中，为提升模型泛化能力与临床可用性提供技术支撑^{［11, 12］}。

3. 国内外人工智能工具对比：尽管核心算法相通，但人工智能在医疗领域的落地应用因数据资源、监管政策及市场环境的不同，在国内外呈现出部分差异^{［13, 14, 15］}。（表1）

二、人工智能在呼吸罕见病诊治中应用的最新进展

（一）IPF

IPF是一种原因不明的慢性进行性纤维化性间质性肺炎，主要发生于老年人，以呼吸困难和肺功能进行性恶化为特征，预后较差^［16］。

1. 生物标志物和诊断模型：人工智能在筛选IPF潜在诊断标志物起到了重要的作用，2024年的一项研究利用机器学习算法分析了1 599例结缔组织病相关间质性肺病与特发性肺纤维化患者血浆蛋白质组学信息，构建出的蛋白质组学模型可以在疑难病例中实现IPF与结缔组织相关间质性肺病的鉴别诊断^［17］。此外，人工智能与单细胞测序、细胞实验等方法结合，筛选出了多种潜在标志物，可以为诊断模型的构建提供参考，也有助于深入了解IPF的病理生理机制并提示潜在的治疗靶点^{［18, 19, 20, 21, 22, 23］}。

Raghu等^［24］在2019年的研究中纳入237例间质性肺病患者，通过经支气管肺活检样本进行转录组测序，并利用机器学习算法开发并验证了分子分类器，结果显示该分类器在 HRCT表现不典型的患者中阳性预测值达81%，与组织病理学诊断的一致性为86%，为特发性肺纤维化的诊断提供了一种侵入性更低、客观且有效的方法，尤其适用于放射学无法明确诊断的患者。

2. 人工智能构建影像模型在IPF诊断、疗效评估和预后预测中的应用：CT影像在IPF的诊断中扮演着关键角色，人工智能影像分析的引入有助于挖掘IPF患者影像资料中的高维信息如细微的结构改变、纹理特征及动态变化规律等，推动疾病精准诊断的实现^{［25, 26］}。2024年由Imvaria公司开发的人工智能Fibresolve在美国获批，可通过分析CT成像数据进行评分，辅助IPF诊断和病情评估，降低需要肺活检的患者数量，并有多项研究验证了其实用性和有效性（表2）。

Kim等^［32］利用基于机器学习的定量肺纤维化评分评估了IPF患者对LPA1受体拮抗剂的治疗反应，发现肺纤维化定量评分的变化与治疗前后肺功能指标改善显著相关，为临床试验的疗效评估提供了新的影像学人工智能评价手段。

2023年的一项研究中，研究者开发了一种基于胸部X光片的深度学习模型，用于估计肺总量，结果显示该模型预测的肺总量与肺功能检测结果高度一致，并能有效预测IPF患者的生存率，为资源有限地区的疾病管理提供了可行方案^［33］。类似地，Thillai等^［34］的一项前瞻性研究中利用基于UNet架构的深度学习模型对446例CT影像数据进行自动分割，并量化了肺体积、血管体积和纤维化体积等指标，发现肺体积每增加0.1 L，5年死亡风险降低2%；血管体积每增加0.1 L，5年死亡风险增加37%；纤维化体积每增加0.1 L，5年死亡风险增加17%，可通过定期复查纵向检测上述指标识别疾病进展，进行临床预后评估，辅助制定治疗策略。

3. 治疗药物筛选：人工智能在辅助药物开发方面同样极具潜力，2024年的一项研究中研究者通过机器学习结合分子对接技术，从 TCMSP 数据库筛选出Herbacetin、swertiamarin、vicenin-2等5个经体外证实具有抗IPF潜力的活性成分，为开发新型抗纤维化药物开辟了途径^［35］。

（二）CF

CF是一种常染色体隐性遗传性疾病，主要由CF跨膜转导调节蛋白基因突变所致^［36］。人工智能在CF 中的应用有以下几方面。

1. 快速汗液收集和测定：CF临床症状复杂多样，诊断困难，其确诊依赖于汗液氯离子检测技术和基因检测，但均具有一定局限性。针对汗液氯离子检测技术耗时长，汗液收集困难的缺陷，Zhou等^［37］结合解吸电喷雾电离质谱和梯度提升决策树机器学习算法，通过分析汗液中的代谢物和脂质特征实现CF诊断，开发了2 min内完成CF患者汗液收集和检测的方法，准确率高达98%，为无创快速诊断CF提供了新的手段。

2. CFTR 基因致病性评估：Lee等^［38］开发的CryptSplice算法通过机器学习预测隐性剪接位点激活，成功识别了CFTR中未被注释的致病剪接变异，完善了基因变异的致病性评估，为CF分子诊断提供了重要工具。

3. 影像学评估和分型：Zucker等^［39］开发了深度卷积神经网络模型，用于自动完成CF胸部X光片的Brasfield评分，其总分预测与放射科医生接近一致，显著提升了临床工作效率。Campredon等^［40］在2022年的研究中纳入了283例CF患者，基于治疗前 CT 的影像组学特征采用k-means 聚类进行无监督机器学习分析，结果显示聚类分析识别的3个形态学亚群中，C群患者的FEV₁改善≥5%的比例显著高于其他亚群，有助于预测患者肺功能改善潜力，为CF 患者的个体化治疗决策提供依据。

4. 患者管理：人工智能也为CF患者的自主监测和智能管理提供了更大的可能。2024年Tzavelis等^［41］设计了一种微型机械声学传感器，结合卷积神经网络算法，实现了儿童CF患者的咳嗽自动检测与分类，其区分咳嗽事件与运动伪影、设备干扰等非发声相关信号的ROC曲线下面积达0.96，且兼具了便携性和实用性，为长期症状监测提供了可靠手段。

5. 人工智能模型辅助预测预后风险：Alaa van der Schaar^［42］开发的自动化机器学习模型通过贝叶斯优化集成多种机器学习算法，基于英国CF注册患者遗传学、肺功能等数据进行训练，预测CF患者3年内死亡、肺移植等不良结局。该模型可将患者分为低、中、高风险组，辅助优化临床决策，提高肺移植转诊精准性，其预测准确性显著优于传统基于FEV₁的标准。2020年Lee等^［43］提出的Dynamic-DeepHit模型则通过分析患者基本信息、疾病相关指标、治疗情况等长期随访数据实现动态更新多风险竞争事件的生存预测，在预测CF患者疾病进展和死亡风险方面表现优异。

此外，人工智能还能识别CF常见并发症的风险因素，及时干预并发症高危人群有助于提高CF患者生存率和生存质量^［44］。

（三）特发性肺动脉高压（idiopathic pulmonary arterial hypertension，IPAH）

肺动脉高压是一种血流动力学疾病，其特征是平均肺动脉压升高>25 mmHg，特发性肺动脉高压是动脉型肺动脉高压疾病的特发类型，具有肺血管阻力增加、肺动脉压力进行性升高的特点，可导致右心衰竭甚至死亡^［45］。

1. 人工智能辅助组学分析探索疾病异质性：IPAH虽被归为同一疾病类别，但患者在生存预后、治疗反应上存在显著差异，传统临床分类难以精准分层，Kariotis等^［46］通过无监督机器学习对全血转录组数据进行分析，将IPAH患者分为预后差异显著的三个亚组型，揭示了IPAH的内部异质性，为个体化治疗策略的制定提供了分析依据。

2. 辅助筛选生物标志物：人工智能可以分析IPAH代谢组学特征，筛选代谢标志物，有助于IPAH的鉴别诊断^{［47, 48, 49］}。Bordag等^［50］利用高分辨率质谱和机器学习基于脂质代谢谱开发的可解释的脂质比值模型，诊断IPAH的受试者操作特征曲线下面积达0.90，在揭示脂质代谢紊乱在IPAH肺血管病理重塑中的潜在作用的同时为IPAH的诊断提供了更加智能全面的工具。

Gao等^［51］通过机器学习分析了1 121例PAH患者的血清抵抗素水平，发现高抵抗素与6 min步行距离缩短、心脏指数降低及死亡风险升高显著相关，为临床风险分层提供了新工具。

（四）淋巴管肌瘤病（lymphangioleiomyomatosis，LAM）

LAM是一种以平滑肌样LAM细胞弥漫性增殖为特征的罕见全身性低度恶性肿瘤疾病，与肺囊性破坏、乳糜液积聚和肾脏血管平滑肌脂肪瘤有关^［52］。

1. 生物标志物挖掘：在LAM的分子层面研究中，人工智能正成为挖掘潜在生物标志物和构建精准诊断模型的重要工具。Mustafina等^［53］基于呼气挥发性有机物建立了非侵入性诊断模型，利用质子转移反应飞行时间质谱结合极端梯度提升算法筛选出乳酸及质荷比113.13特征离子等关键标志物，模型的受试者工作特征曲线下面积达到0.922，可用于疾病分层及气胸等并发症预测。

Kirkpatrick等^［54］针对LAM患者蛋白酶失调及酸性微环境的特点，开发了一种尿液蛋白酶活性纳米传感器，借助随机森林算法分析传感器数据区分LAM疾病模型与对照小鼠，并可评估西罗莫司治疗反应。

2. 疾病危险分层和进展预测：LAM患者肺功能变化是其病情监测的重要指标，多项研究用机器学习方法围绕LAM患者FEV₁的动态变化构建预测模型，识别出西罗莫司治疗、VEGF-D、肺一氧化碳弥散量等核心预测因子，通过精准预测LAM患者的FEV₁下降轨迹实现更便捷精准的疾病进展预测和管理^{［55, 56］}。

Chernbumroong等^［57］对359例LAM患者采用无监督机器学习进行聚类分析，得到3个聚类集群，聚类1以气胸和呼吸困难为主，预后最差；聚类2多并发结节性硬化症和血管平滑肌脂肪瘤；聚类3发病较晚，症状不典型；为患者个性化风险评估、并发症预防提供了新的视角。

此外，人工智能还可以通过分析LAM患者CT影像，辅助定性囊性病变性质以及量化肺内受累程度，提供更加便利的鉴别诊断和长期监测手段，通过减少LAM的诊断延迟，评估疾病进展和治疗反应助力临床调整治疗方案，提高患者生存质量^［58］。

（五）PAP

PAP是一种弥漫性肺部疾病，以肺泡和细支气管腔内充满过碘酸雪夫染色阳性的富磷脂蛋白质样物质为特征^［59］。

在PAP的诊疗评估中，传统CT评估主要依赖医师经验判断，存在主观性强、难以精确量化等问题。基于人工智能的CT定量分析技术为此提供了新的解决方案。McCarthy等^［60］应用CALIPER软件对一例PAP患者进行自动化肺实质分析，通过无监督聚类算法将肺组织划分为8类放射学模式，用于评估该患者治疗前后疗效。Shi 等^［61］在2022年的一项研究中纳入50例PAP患者，采用基于卷积神经网络的CT定量分析方法，评估患者接受他汀类药物治疗前后全肺及各肺叶的磨玻璃影占比的变化，结果显示深度学习量化的磨玻璃影变化与多种关键临床指标的变化显著相关，能更好地反映病情改善与肺功能变化的关联，证实了人工智能在精准诊疗和疗效监测的潜力。

三、人工智能在呼吸罕见病诊治领域的挑战

人工智能在呼吸罕见病领域的实际应用，仍面临不少棘手问题。第一，呼吸罕见病本身患病率低，国内目前缺乏统一、高质量的多中心专病数据库，缺乏整合相关诊疗资源、政策信息与临床试验的官方或行业性平台，使得研究开展难以系统获取有效支持，多数研究依赖单中心或小样本数据，易导致模型过拟合与泛化能力不足。第二，不同医疗中心的数据格式、采集标准各不相同，数据标准化不足，严重影响了模型在不同环境下的泛化能力和运行结果的稳定性。第三，当前人工智能进行决策的依据往往呈“黑箱”状态且难以避免幻觉和虚假内容的产生，其结果的可信度也因此受到质疑。

在监管与支付层面，针对此类工具的伦理审批路径尚未成熟，监管框架仍在完善过程中，加之技术验证体系尚不健全，目前获批的人工智能医疗器械均被归为Ⅲ类高风险器械，面临严格的审批要求和较长的审评周期。同时绝大多数人工智能产品尚未被纳入医保支付范围，缺乏明确的收费路径，均极大地限制了产品的市场渗透率和医院的投资意愿，阻碍了人工智能辅助诊疗工具在临床环境中的实际落地应用^{［13, 14, 15］}。

未来需加强数据标准化与共享机制建设，积极推动多中心学习和联邦学习，完善监管与审批政策，推动医工交叉合作，提升人工智能系统的可解释性与临床适用性。同时构建面向医患的智能信息整合平台，提高人工智能服务的可及性，推动其在实际诊疗中的规范化与普及化。

四、总结

综上所述，人工智能在呼吸罕见病的诊疗场景中，显露出了广阔的前景。传统机器学习，深度学习，强化学习等多种技术手段的应用，推动了罕见病的早期识别、精确诊断，个性化治疗方案的实现，也推动着呼吸罕见病的管理模式慢慢向个性化智能化方向转变。人工智能将为呼吸罕见病的诊疗提供更为强大的支持。

参考文献（略）