当地时间5月2日至5日,2026年美国消化疾病周(DDW 2026)将于美国芝加哥盛大启幕。本届大会汇聚全球前沿创新成果,中国学者三百余项研究成功入选,充分彰显了我国消化疾病领域的科研实力与临床转化能力。会议期间,

研究一:大语言模型驱动的IBD真实世界试验:基于多中心电子病历的开放词汇提取药物不良事件
(Presentation Number: Tu1509)
药物不良事件(adverse drug events, ADEs)是可预防性医疗损伤的主要来源之一。EHR由于具备专业性强、信息客观完善、记录及时等特点,已成为ADE监测的重要信息来源。基于EHR开展ADE主动监测,既契合真实世界研究需求,也具有较强的临床应用价值。然而,EHR中的大量ADE相关信息主要分散于门诊病历、住院病历、护理记录和病程记录等非结构化文本中,且由于IBD疾病活动表现、IBD患者的多药联合治疗等特点,使提取任务充满挑战。传统命名实体识别(Named entity recognition , NER)-关系抽取(Relation extraction, RE)流程及固定词汇表常无法捕捉不断演变的临床表述。大语言模型(LLMs)在ADEs检测方面展现出潜力,然而,目前大多数方法并非端到端,且依赖于受限的注释模式,这限制了其在IBD领域的规模化应用和真实世界中的泛化能力。
为了解决上述问题,本研究拟开发一种面向多中心中文IBD电子病历的ADE提取框架。该模型基于本中心真实世界IBD患者病历数据进行训练,并在来自另外两家医院的IBD病历数据上开展外部验证,以评估其泛化性能。针对多中心非结构化临床文本在表述方式、术语习惯和书写风格上的显著差异,为实现IBD病历文本中ADE的实时化、自动化识别,构建一种基于LLM的端到端的IBD常见治疗药物的开放式ADE抽取框架。
框架从输入到输出主要包括3个组成部分:①病历预筛查模块:用于保留合理的ADEs信号并最大程度减少不必要的LLM调用;②开放式提取模块:基于药物-事件二分网络的图谱检索,以拓宽候选范围;基于自学习指令集的集成LLM推理;以及③标准化模块:将术语与MedDRA对齐并确保不良件的一致性。
本研究构建了三个去标识化数据集:内部
研究最终选择了HYBRID + LR模型进行后续分析,该模型在克罗恩病(CD)测试集中的曲线下面积(AUC)为0.809(图3A),在溃疡性结肠炎(UC)测试集中的AUC为0.828(图3B)。
在药物-事件对抽取层面,所提出框架优于传统监督方法及单一LLM模型:在CD队列中,precision为0.638、recall为0.781、F1值为0.702;在UC队列中分别为0.722、0.712和0.717;在外部验证集中分别为0.564、0.775和0.613,显示出良好的跨中心泛化能力。
研究二:多中心纵向队列试验,基于Transformer时间感知AI模型预测CD进展
(Presentation Number: Tu1514)
克罗恩病(Crohn's Disease, CD)是炎性肠病(Inflammatory Bowel Disease, IBD)的重要亚型之一,影响着全球大量人口,并在疾病行为进展后往往意味着用药升级及手术,给患者带来巨大的医疗负担。因此,既往众多研究聚焦CD风险因素和预测模型的探索。然而,CD是一种慢性动态进展的疾病,既往CD预测模型大多为仅利用基线数据的传统模型,未能充分考虑疾病病程中发生的医疗事件也不能做到实时动态调整对CD进展的预测,导致多数医生在调整CD患者治疗策略前疾病行为即将进展或已进展,错过预防的机会或及时治疗的时机。
本研究开发了一种基于Transformer的预测框架——时间感知CD进展预测模型(CD-ProFormer),旨在利用患者在预测时间点前所有纵向电子病历(EHRs)包括实验室检验结果,用药情况,手术情况,蒙特利尔分型等病历资料实现预测未来CD疾病行为进展的可能性;并与长短期记忆网络(Long Short Term Memory, LSTM)模型、门控循环单元(Gated Recurrent Unit, GRU)模型、Logistic回归模型和Time-Varying Cox回归模型比较预测效能。
在数据收集方面,研究人员从北京协和医院收集了761名CD患者的11,984次就诊记录,共包含66个静态和动态变量,作为内部训练/验证队列。此外,研究还纳入了外部数据74名CD患者的510次就诊数据,以及来自南京金陵医院的271名CD患者的3934次就诊数据作为外部验证集。
CD-ProFormer模型旨在预测从预测起始点起算1年、3年和5年内发生CD疾病行为进展,手术,用药升级三种类型事件的风险概率。此外,该模型还实现了对疾病进展窗口的预测,包括在0-1年内、1-3年内、3-5年内的进展,或5年内无进展。同时,本研究还通过DTW-Kmeans计算了每个变量的SHAP动态变化值,以展示其与结局的关联。
本研究开发的CD-Proformer模型整合了多个创新模块:①缺失值与插值处理模块:通过前向和后向以及事件加权平均插补补齐电子病历中的缺失值;②专家知识模块,结合既往共识及文献中的风险因素,提前调整EHRs中各事件的权重,为模型的训练提供方向,加速模型的训练速度:③时间感知模块:对全局和局部病历时间进行编码,以保持访问顺序,捕获多尺度时间动态,并通过多头注意更好地建模不规则采样下的
CD-Proformer模型在内部验证中表现优异:在预测1年、3年和5年疾病行为进展方面表现出卓越的性能,其受试者工作特征曲线下面积(AUROC)值为0.910-0.979。相比之下,LSTM模型AUROC为0.835-0.955,GRU模型AUROC为0.821-0.955,Time-Varying Cox模型AUROC为0.618-0.714,Logistic回归模型AUROC为0.722。
在预测1年、3年和5年内术方面,CD-Proformer的AUROC值为0.729-0.823;LSTM模型、GRU模型、Cox模型和Logistic回归模型AUROC值别为0.698-0.715、0.704-0.724、0.711-0.729和0.708。
在预测1年、3年和5年
在预测1年、3年和5年免疫抑制剂使用风险方面,CD-Proformer的AUROC值为0.796-0.901。相比之下,LSTM模型、GRU模型、Cox模型和Logistic回归模型AUROC值分别为0.735-0.855、0.738-0.854、0.461-0.469和0.544。
在预测1年、3年和5年生物制剂使用风险方面,CD-Proformer的AUROC值为0.939-0.943。LSTM模型、GRU模型、Cox模型和Logistic回归模型AUROC值则分别为0.844-0.873、0.831-0.874、0.671-0.692和0.782。
在预测CD相关医疗事件方面,本研究开发的CD-Proformer模型具有较LSTM、GRU以及传统模型更优的预测结果,在未来将验证其对临床医师的决策辅助作用。
研究三:“菌群-膳食-免疫代谢”精准营养干预新策略,缓解UC患者疾病进展
(Presentation Number: Tu1541)
受遗传易感性及环境因素复杂相互作用的影响,全球溃疡性结肠炎(UC)发病率持续上升。作为关键的环境因素之一,肠道菌群在调节肠黏膜免疫反应中发挥核心作用。然而,目前能够有效整合微生物组研究与个性化膳食干预的临床策略仍较为缺乏。
本研究通过宏基因组学和膳食平台整合分析,明确参与膳食-微生物群共代谢的关键微生物膳食降解基因表达的差异;并通过分子实验和小鼠模型进行功能验证,探究膳食变化和微生物相互作用对细胞应答的影响,从而更深刻地理解膳食纤维降解所激活的代谢途径。
通过宏基因组学与膳食平台整合分析,研究显示UC患者肠道内一种拟杆菌的丰度显著降低,同时其编码的膳食聚糖降解酶基因的表达也明显下降,提示该菌群-膳食共代谢通路的受损。在DSS诱导的结肠炎小鼠模型中,补充该拟杆菌和膳食聚糖可显著促进肠道内半
本研究提出了一种创新的“菌群-膳食-免疫代谢”精准营养干预新策略,为阐释UC发病机制提供新见解,为靶向营养治疗开辟新方向。
杨红 教授
北京协和医院消化内科副主任 主任医师 博士研究生导师 教授
中华医学会消化病分会炎症性肠病学组副组长
北京医学会肠道微生态和
北京医学会临床流行病循征医学分会候任主任委员
中华医学会临床流行病和循证医学分会常委兼秘书长