能看懂手术的AI:何建行团队发布首个胸外科手术生成式AI系统LungSurg
2026-01-29

图片


图片

在早期的非小细胞肺癌治疗中,胸腔镜肺叶切除术早已成为公认的金标准。这种微创手术方式虽然极大地减轻了患者的痛苦,加速了康复进程,但对于主刀医生而言,每一台手术都是对技术与心态的极致考验。


胸腔内部的解剖结构宛如一座复杂的迷宫,血管与支气管在狭窄的空间内交错生长,且每个人的体内结构都像指纹一样独一无二。再加上手术过程中镜头不可避免的抖动、器械的视线遮挡,甚至是电刀作业时产生的烟雾,都在时刻干扰着医生的判断。


AI技术辅助绘图、写作已成常态的今天,外科医生们也在期待:人工智能能否不仅是简单的辅助工具,而成为手术台上那双看透迷雾的眼睛和传道授业的超级导师


带着这样的思考,广州医科大学附属第一医院何建行、梁恒瑞团队历时数年,联合全国8大中心构建了高质量标注数据库,成功开发出首个专为胸腔镜肺叶切除术设计的生成式AI系统——LungSurg。这一成果近期已发表于MedComm(一区,IF=10.7,共同第一作者:晏泽平工程师张育东博士

图片


part


01

像做完形填空一样训练AI

这套系统的诞生,首先解决的是医疗AI开发中最大的拦路虎——数据稀缺。在复杂的胸外科手术中,如果要依靠人工对每一帧画面进行像素级的标记,成本极其高昂且效率低下。研究团队历经数年时间,建立了约150万帧图像,32,027个解剖结构/器械的像素级手动标注胸外科手术录像数据库,为该研究打下了坚实的数据基础。


为了进一步解决高质量标注数据不足的问题,LungSurg的引入了类似大语言模型的“生成式预训练”策略。这就好比让AI做“完形填空”:系统从海量没有标签的手术视频中提取画面,随机遮挡掉25-75%的内容,然后强迫模型利用仅存的信息去“脑补”并重构出缺失的解剖细节。


这种严苛的自监督学习过程,逼着AI不再是简单地死记硬背图像,而是必须深刻理解胸腔结构的解剖规律和空间逻辑,从而练就了在极少样本下也能应对复杂解剖变异的识别能力。同时,研究团队还引入了基于观察对象对共现概率的损失函数,利用器械与解剖结构(如切割缝合器常与肺血管共现概率高)的关联性来辅助识别,提高识别准确率。

图片


part


02

双脑协同:

既能看清,又能看懂

LungSurg之所以“聪明”,还因为它拥有一套“双脑协同”的工作机制。系统内部包含了两个紧密配合的网络:一个是负责“看”的分割网络(SurgSeg),另一个是负责“想”的分类网络(SurgClass)。


SurgSeg就像是手术台上的数字化显微镜,它利用先进的特征提取技术,能够在复杂的视线干扰中精准勾勒出肺动脉、肺静脉、支气管以及各种细长手术器械的轮廓,在外部验证中表现出了极高的稳定性。


而SurgClass则更像是一位统筹全局的指挥官,它参考专业标准,将肺叶切除术拆解为肺血管处理、淋巴结清扫等14个标准化阶段。通过分析画面的时间与空间特征,它不仅能识别眼前的静态画面,更能理解时间维度的上下文逻辑,精准判断手术进行到了哪一步。

图片


part


03

透视复杂术野的火眼金睛

这种技术突破带来了直观的视觉识别获益。手术室的环境往往充满了干扰,视线经常被烟雾笼罩或被器械遮挡,组织也会因牵拉而变形。


但在可视化测试中,在外部验证中心中,LungSurg展现出了良好“透视”的能力。无论背景多么嘈杂,面对纵横交错的细小血管分支,它都能生成边缘清晰的彩色掩膜,仿佛穿透了表层的视觉噪声,直接锁定了核心的解剖结构。

图片


part


04

走出实验室,拒绝水土不服

为了验证这并非“花架子”,研究团队利用多中心独立测试集进行了严苛的定量考核。在包含3个中心的外部验证集中,LungSurg 对左肺的平均精度(mAP)达到 0.745,右肺为 0.726;器械识别:电凝钩(0.864)、超声刀(0.777)、吻合器(0.868);解剖识别:肺动脉(0.607)、肺静脉(0.601)、支气管(0.667)和淋巴结(0.777)。


模型在识别左右肺关键解剖结构(如血管+支气管)上的平均精度(mAP)分别稳定在0.745和0.726,对高频手术器械的识别精度更是突破了0.97。


更难能可贵的是,即便在从未见过的外部中心数据上测试,模型性能依然稳健,这打破了传统AI“出了实验室就失效”的魔咒,证明了它具备跨医院、跨设备的真实落地能力。

图片


part


05

比专家更“敏感”的安全哨兵

系统将手术分为14个阶段,包括肺血管处理、支气管离断、肺裂解剖、淋巴结清扫等。在外部验证中,其 Top-1 准确率为 71.5%,Top-3 准确率为 88.0% 。 在关键的“肺血管处理”阶段,Top-1 准确率高达 0.988。


为了检验AI在临床实战中的价值,团队还安排了一场特殊的“人机对比”。通过将AI预测的手术内容的时间轴与真实进程叠加,两者惊人地重合,证明AI已能精准把控手术节奏,看懂外科医生“在干什么”。


图片

而在识别关键解剖结构的任务中,研究安排了LungSurg与3名高级外科医生、5名初级医生的对照实验:虽然人类专家在判断的确信度上略胜一筹,但AI在灵敏度上达到了0.777,显著高于人类医生的0.533。这意味着,AI就像一个不知疲倦的“安全哨兵”,在快节奏的手术中,AI 可作为“冗余监控器”,提醒医生关注那些可能被肉眼忽视的解剖细节。

图片


part


06

缩短成才周期:

实习医生的“超级导师”

除了术中辅助,LungSurg在教学领域的潜力同样巨大。团队开展了一项针对20名一年级住院医生的教育研究,评估 AI 是否能缩短学习曲线。


使用LungSurg交互平台的实验组经过一周训练,解剖结构识别准确率达到73.40%,显著高于传统教学组的63.0%;在更能体现综合判断力的手术阶段分类任务中,准确率更是从65.4%大幅提升至79.2%。这表明,AI提供的实时反馈能有效降低新手的认知负担,帮助他们更快掌握复杂手术的“视觉语法”。


part


07

研究局限性

尽管 LungSurg 表现稳健,但研究团队在论文中坦诚地指出了目前的局限。同时,这也是该研究未来努力的方向。极端病例:初始训练集排除了重度粘连、大出血或严重畸形等极复杂案例,未来需增加此类数据的泛化测试实时性能:目前的离线分析在低延迟优化上仍有提升空间,需通过模型剪枝、量化等技术进一步提升处理速度。视觉韧性:在重烟雾、镜头模糊或剧烈器械运动等特殊情况下,性能仍存在波动。


总结

总的来说,无论是作为资深医生的术中安全助手,还是年轻医生的伴随式导师,LungSurg都展示了人工智能深度赋能现代外科医疗的广阔前景。


LungSurg不仅是一项算法上的创新生成式AI技术在胸外科领域的突破应用LungSurg证实了利用生成式技术解决医疗数据标注难题的可行性,展示了AI识别器官进化到理解手术逻辑的质的飞跃为下一步研发自动肺部手术提供了可参考的“手术知识图谱”




    参考文献:

    Liang H*, Yan Z*, Zhang Y*, Dai K, Li H, Shen J, Li P, Jiang J, Zhang G, Zhang X, Chen H, Zhang H, Zhang Y, Liang S, Chen M, Wang X, Rao A, Wang W, Zhao L, Guo Y, He J.

    LungSurg: A Generative AI System for Segmentation and Phase Classification in Thoracoscopic LobectomyMedComm (2020). 2026 Jan 20;7(2): e70613. doi: 10.1002/mco2.70613. PMID: 41574025; PMCID: PMC12820416.






    来源:南山呼吸

    审校:Faline

    排版:Faline

    执行:Faline







    医脉通是专业的在线医生平台,“感知世界医学脉搏,助力中国临床决策”是平台的使命。医脉通旗下拥有「临床指南」「用药参考」「医学文献王」「医知源」「e研通」「e脉播」等系列产品,全面满足医学工作者临床决策、获取新知及提升科研效率等方面的需求。

    本平台旨在为医疗卫生专业人士传递更多医学信息。本平台发布的内容,不能以任何方式取代专业的医疗指导,也不应被视为诊疗建议。如该等信息被用于了解医学信息以外的目的,本平台不承担相关责任。本平台对发布的内容,并不代表同意其描述和观点。若涉及版权问题,烦请权利人与我们联系,我们将尽快处理。

    图片

    (本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)

    0
    收藏 分享