作者:海军军医大学第二附属医院长征医院颈椎外科 张本博
随着医疗数据激增和计算机算力提升,人工智能(AI)已广泛应用于医学图像分析、临床决策支持和手术辅助等多个领域。脊柱外科作为高度依赖术前评估和术中导航的专科,对影像和解剖结构识别的要求极高,因此成为AI最早落地的外科方向之一,目前基于深度学习的AI模型已广泛应用于脊柱影像识别分割、病灶识别、风险预测等任务,其诊断精度可与专家水平媲美。然而,这些模型多为判别式AI,主要用于识别和分类,难以满足临床上对生成型数据的多样化需求。
近年来,生成式人工智能(Ge⁃nAI)技术迅速发展,代表性技术包括大语言模型(LLMs)与生成对抗网络(GANs)等。与传统模型不同,GenAI不仅能识别,还能“生成”新型文本、图像乃至三维结构。在脊柱外科领域,GenAI的潜力正在被不断挖掘:它可以通过自然语言交互辅助患者教育、利用影像数据生成三维结构重建模型、提升术中图像质量并规划螺钉路径。为外科医生及手术场景赋能,具有广阔的应用前景。本文将围绕GenAI在患者服务、医学影像分析与手术辅助三方面的应用,系统梳理其在脊柱外科领域的最新研究进展与未来趋势。
生成式人工智能在患者服务中的应用
对于脊柱外科患者而言,获取有效医疗信息始终面临挑战。传统的医患沟通存在信息壁垒,患者对疾病理解有限、术后依从性差,影响康复质量。生成式人工智能——特别是LLMs(如ChatGPT、文心一言、豆包等)——正逐步成为患者教育与沟通的重要工具。多项研究表明,GenAI在回答疾病基础问题(如症状、手术指征、术后护理)方面表现出较高的准确性与通俗表达能力。例如,Ahmed等对比了ChatGPT与北美脊柱外科协会指南内容,发现其在退行性脊柱滑脱等问题上能提供清晰、贴近临床的解释。Miller等指出,ChatGPT在颈椎融合术常见问答中的一致性与全面性表现良好,可作为患者初步获取医疗信息的辅助渠道。此外,Lang等总结了4种大语言模型(ChatGPT-3.5、Bard、BingAI、You⁃Chat)回答患者对于腰椎间盘突出症的常见问题方面的表现,71.1%的问题答案被认为是“优秀”或者“满意”,表明大语言模型在帮助患者快速了解疾病、增强沟通方面具有正向价值。不仅如此,GenAI还能基于电子健康记录与个人信息进行个性化互动,为患者提供更具针对性的回答,依托这一功能,可以提升患者对诊断、治疗流程的理解,进而强化术前配合与术后依从性。在心理支持方面,GenAI也显示出积极潜力。接受脊柱手术的患者常伴焦虑与抑郁情绪,而通过心理健康对话机器人进行初步交流,可减少就医羞耻感,提升主动就诊意愿。
不过,当前GenAI模型仍存在明显局限。一方面,其表达复杂度普遍偏高。例如,Subramanian等对ChatGPT在颈椎手术(ACDF/CDR)问答的可读性分析发现,尽管回答结构清晰,但阅读难度远高于医学会建议的6~8年级水平,不利于低教育程度患者理解。另一方面,GenAI仍可能生成逻辑连贯但事实错误的“幻觉内容”。Altorfer等研究发现,在使用Claude与Gemini等模型回答指南类问题时,约24%的参考文献为虚构,且部分内容引用新闻、保险等非医学来源信息。因此,尽管GenAI在患者教育与沟通中展现出巨大潜力,但其生成内容仍需医生审核把关,以确保符合循证医学标准,防范错误信息带来的潜在风险。
生成式人工智能在医学影像分析的应用
X线片、CT、MRI等影像检查是识别解剖结构与病理变化的核心手段。然而,传统图像分析方式存在效率低、主观差异大等问题,临床仍缺乏高效、标准化的图像处理工具,急需智能化技术辅助。GenAI为该领域带来突破性的可能,早期基于深度学习的AI模型已可自动识别脊柱侧弯、椎管狭窄、骨质疏松等疾病。同时依托深度学习算法发展既可以实现椎体分割与Cobb角的自动测量,也可以通过CT、MRI等影像实现椎骨及椎间盘分割、相关指标的自动测量等。但这些模型依然依赖已有图像,无法“创造”新数据。GenAI则能基于现有二维影像合成三维结构、构建拟真图像模型,为术前评估与诊断提供增强支持。例如,Chen等开发的ReVerteR模型融合GAN与自注意力机制,能够基于脊柱正侧位X线片自动生成高质量的3D椎体模型,其重建精度超过传统TransVert与BX2S-Net模型。此类技术不仅有望替代部分CT扫描,还能在降低辐射风险的同时,提升图像分辨率与解剖结构还原度。除了图像增强,GenAI还推动了“非辐射替代方案”的出现。Meng等构建了一套结合可移动光学感应装置与GenAI系统的无辐射平台,可将RGB-D图像合成为类X线图,用于青少年特发性脊柱侧凸评估。研究显示,该方法在评估侧弯严重程度和类型时的准确率高达0.909和0.974。另外,Gafencu等将GenAI技术应用于3D超声的点云补全,有效克服传统超声图像中的遮挡与伪影干扰,显著提升椎体重建的完整性和几何精度。
尽管GenAI在影像合成方面表现出显著优势,但仍面临多重临床挑战。一是合成图像的精度尚不稳定。Roberts等发现,虽在矢状面上重建误差较低(<10%),但在横断面图像中,椎弓根宽度的误差最高可达34%,尤其在存在金属植入物时,伪影干扰极为严重。二是训练数据缺乏多样性。大多数模型基于单中心影像数据构建,缺乏跨医院、跨设备的泛化能力。三是可解释性弱,信任门槛高。GenAI常被视为“黑箱”,临床医生难以理解其图像生成与判断依据,导致使用意愿受限。
生成式人工智能在脊柱外科手术的应用
在脊柱手术中,术中图像质量直接影响导航精度与手术安全。然而,当前使用的C臂机、O臂机或锥形束CT等设备常面临图像模糊、信噪比低、结构边界不清等问题。GenAI凭借图像增强与生成能力,有望显著改善术中成像质量。Gadu等提出了一种融合GAN与量子U-Net的模型,可通过学习术前CT图像与术中二维影像的映射关系,实现术中二维图像向三维脊柱结构的重建,提升空间定位与可视化效果,该方法尤其适用于复杂椎体解剖区域,辅助术中快速构建立体导航参考。在术前路径规划方面,Ma等开发的Bone'sTrajectory系统基于U-Net与MarchingCube算法,能够自动识别椎弓根并生成最优螺钉路径规划。实验证明,该系统生成路径的骨密度与拔出力均优于AO标准推荐方案,体现其在提升植入物稳定性方面的潜力。
与此同时,GenAI在术中信息识别领域也展现出实用价值。Agaronnik等构建的自然语言处理(NLP)系统,利用LLMs和深度学习模型自动解析术中神经监测报告,识别信号变化和异常事件。该系统F1得分达0.80,ROC曲线下面积高达0.97,可实现非结构化术中记录向结构化事件标签的转化,提升术中监控与术后评估效率。更具前瞻性的探索还包括GenAI与增强现实(AR)、外科手术机器人的集成应用。Auloge等构建的AR+AI导航系统在椎体压缩骨折治疗中,通过虚拟三维重建与真实术野映射,精准生成进针轨迹,相比传统透视导航,显著减少辐射暴露,并提升手术精度。与此同时,外科手术机器人依托AI得到了快速发展,Min等提出将大型视觉模型与手术机器人协同发展:LVMs在上游完成术中影像识别、空间配准与路径规划,机器人系统则在下游执行精细操作。这一模式构想推动外科从“人控制机器”逐步迈向“人机协同操作”,并为“机器人外科医生”的长期愿景奠定基础。GenAI正逐步融入脊柱手术流程,从图像质量优化到智能路径规划,再到术中数据结构化与设备协同,为脊柱外科手术带来深层次变革。但其全面应用仍需面对系统可靠性验证、术中突发情况响应、伦理法律边界等关键瓶颈。
总结与展望
GenAI正逐步重塑脊柱外科的诊疗模式。它不仅提升了医患沟通效率,增强了患者的主动参与感,还通过图像重建和术中导航等技术手段,为手术精准化、流程自动化提供了坚实支撑。在患者服务方面,GenAI通过语言生成技术,有效降低了医疗信息获取门槛,拓展了科普的传播形式。在医学影像中,Ge⁃nAI推动了高质量图像合成与无辐射替代方案的应用。在手术辅助层面,其支持术前路径优化、术中图像增强和术中事件识别,并向AR融合与机器人手术不断延展。
尽管GenAI医疗领域潜力巨大,在其临床应用仍需突破以下瓶颈:(1)当前主流GenAI模型多采用“黑箱”架构,缺乏对输出过程的透明化呈现,医患双方均难以理解模型给出判断或者建议的原因,甚至会出现与事实相悖的“幻觉”风险,导致存在信用障碍,对此需要进一步提高模型的可解释性,使模型决策过程可视化,这是未来实际应用于临床的关键前提;(2)由于当前大多数GenAI信息库建立于普遍性的信息及影像数据的基础之上,缺乏对个体的精准建模,使得在应对复杂多变的脊柱疾病时,难以针对不同患者给出最佳治疗方案,这依靠于在确保维护患者隐私的前提下,在模型中融入多模态个体信息(包括基础情况、影像信息、临床量表等),使输出结果更具个性化,实现精准建模;(3)大部分GenAI模型研究为单中心、特定设备下的研究,缺乏不同医院、不同设备、不同人群的外部验证,导致模型泛化能力有限,因此,依靠未来建立多中心广泛合作的信息平台,以提升训练效果,扩充训练量;(4)尽管现在GenAI已在机器人手术导航技术中有所进展,但“机器人自主手术”仍需面对伦理、法律和技术瓶颈。导航模型尚不能及时识别并处理突发情况,也难以动态适应各种手术复杂操作。因此完全自主化在短期内难以实现,更切合实际的发展路径是“人-机协同”,以GenAI为“助手”而非“术者”。在未来,随着多中心数据协作、算法可解释性提升与医学伦理制度的完善,生成式人工智能有望成为推动脊柱外科进入“智慧医疗”时代的关键引擎,真正实现高效、精准、个体化的诊疗新范式。
来源:中国矫形外科杂志2026年4月第34卷第8期