作者:上海交通大学医学院附属第六人民医院临床研究中心 沈力
骨质疏松性椎体压缩骨折(OVCF)是骨质疏松症最严重的并发 症 之一,指的是在受到轻微外伤、甚至没有明显外伤的情况下发生的椎体骨折。临床上主要表现为非常剧烈的腰背部疼痛,同时还会出现脊柱后凸形态上的异常改变,以及神经功能方面损害等。课题组前期在上海社区开展流行病学调查研究结果显示,年龄达到60岁及以上老年人群中,OVCF的患病率达到了17.2%,并且随着年龄不断增长,其患病率以及多个椎体同时受累的比例均呈现出较为明显的上升趋势。OVCF不仅发病率比较高,所带来的危害也相当严重,同时还是造成老年人群致残和致死的重要原因之一研究显示,骨折发生后1年内,约20%患者死于各种并发症,50%的患者出现致残和生活质量显著下降,且再发骨折的风险显著增高。所以,OVCF总体呈现出患病率高、致残率高以及死亡率高的特点。针对那些存在较高风险的人群,开展早期识别工作并且尽早启动抗骨质疏松方面的治疗干预,对于提升骨骼质量、预防后续骨折事件的发生、改善患者的远期健康结局以及整体生活质量而言,都具有十分重要的临床价值和公共卫生意义。
近年来,随着人工智能技术的快速发展,医学影像智能诊断领域已经取得了较为显著的进展。人工智能如今已被广泛地应用到 X线片、CT及 MRI等各类医学影像的分析工作中,从而在临床诊断准确率方面实现了较为有效的提升。其 中,卷 积 神 经 网 络 (CNN)作为一种被广泛应用的深度学习算法,能够从医学图像中自动识别关键特征,将肉眼难以识别的信息提取出来,并且还能够依靠原始图像实现对高级抽象特征的自主学习过程。本文就人工智能在 OVCF诊断中的应用现状及进展进行综述。
人工智能在 OVCF诊断中的应用现状
OVCF的发病过程中,症状表现往往并不明显,大部分患者并没有明确外伤史,或者仅存在轻微程度的外伤。临床上患者就诊时通常表现为腰背部疼痛和活动能力受限,导致在 OVCF实际诊断工作中易出现较高的漏诊率和误诊率。OVCF的诊断工作主要依靠医学影像检查,由于中国人口老龄化趋势不断加剧,对于医学影像检查的需求量也急剧上升,给整个医疗系统带来严重的诊疗压力,也使不少患者难以及时获得最终的诊断结果,从而延误治疗,以致错过最为适宜的干预窗口期。与此同时,在传统人工影像阅片的过程中,由于不同医生之间的工作年限以及临床经验存在较大差异,再加上目前尚缺乏一套运行效率较高、可用于骨折诊断工作的定量分析工具,使得 OVCF诊断结果的准确性与不同医生之间的一致性均不够理想。既往多中心研究结果表明,椎体骨折的漏诊率和误诊率高达34%~45%。因此,怎样提高 OVCF的诊断准确性以及诊断效率,已成为目前临床诊疗工作中亟待解决的重要问题。近年来,随着计算机科学技术的快速发展,人工智能在医学影像诊断中取得了实质性进展,特别是深度学习这类技术,目前已在 X线、CT 和 MRI影像等检查中得到较广泛的运用,借助人工智能技术所提供的支持与辅助,临床诊断工作的效率和准确率均获得了较为明显的提高。
基于 X 线片的智能辅助诊断 X 线片检查操作简便,成像迅速,同时具有较强的可及性、较广的适应范围、相对较低的辐射剂量及检查成本,已成为临床上用于椎体骨折诊断的首选影像学检查方法。既往研究开展了基于 X 线片的椎体骨折智能诊断相关研究,而在算法构建这一环节中,多数研究采用 CNN 进行相应的图像处理工作。Chen等借助824例受试者的 X线片,构建了一套能够对新发椎体骨折与陈旧椎体骨折加以鉴别区分的深度学习算法,研究结果表明,该算法在椎体骨折诊断任务中的灵敏度、特异度以及受试者工作特征曲线下面积(AUC)分别达到80%、68%和0.80;不过,该研究并未在外部多中心数据中进行进一步验证。Xu等运用 ResNet-18架构开展迁移学习模型的构建工作,该模型把 X 线片作为输入依据,实现椎体骨折的自动化诊断任务;研究结果显示,该模型在急性骨折、慢性骨折及病理性骨折这三类情形下的诊断性能处于较高水平,其诊断准确率超过具有不同从业年限和临床经验的骨科医生。Hong等借助 CNN 对脊柱 X 线片开展椎体骨折诊断的相关研究,所构建模型在诊断任务中 AUC 达到0.92,整体诊断性能表现良好,不过该模型在骨折分度这一环节尚难以做到精准判定。而骨折分度的精准诊断,在临床治疗方案的制定过程中具有重要意义,如抗骨质疏松症药物的选择及疗效评估工作,往往都依赖于骨折严重程度所做出的准 确 判 断。Shen 等建 立 了 首 个 基 于 X 线 片 进 行OVCF及其分度的智能辅助诊断算法,该算法在设计过程中参考了 Genant半定量评估法,能够自动实现椎体位置定位工作,并对椎体面积损失比进行较为精确的计算,实现椎体骨折及其分度的精准诊断;研究结果表明,该算法对 OVCF诊断的准确率、灵敏度和特异度分别为96.85%、83.35%和94.70%,其中针对中度椎体骨折的诊断,其灵敏度与特异度分别为85.61%和99.85%,而针对重度椎体骨折诊断,其灵敏度和特异度分别为93.46%和99.92%。
基于 CT影像的智能辅助诊断 尽管 X 线片在临床中具有较高的可及性,并且在成本方面也具有一定的优势,但它对椎体结构中较为细微的异常显示能力相对有限。因此,在临床实践过程中,CT和 MRI这类高分辨率影像检查手段得到了广泛的运用。Al-Helo等最早研发了依托 CT影像所构建的全自动计算机辅助诊断系统(CAD),该系统在 OVCF 诊断中展现出突出的 性能,其诊断准确率超过90%。Kolanu等随后对 CAD 系统在 CT图像中用于 OVCF诊断的临床效能进行了系统性评估,研究结果表明,该系统诊断 OVCF的灵敏度、特异度和准确度分别为54%、92%和83%,而对中重度骨折诊断,其灵敏度、特异度和准确度分别为65%、92%和88%;由此可以说明,该系统在临床辅助决策方面具备较好的应用价值。Zhang等基于 CT胸腰椎影像资料及 AOSpine胸腰椎损伤分类系统,借助深度学习算法构建了椎体骨折的自动诊断与分类模型;研究结果表明,该系统在椎体骨折诊断方面的灵敏度、特异度和准确度分别为95.23%、98.35%和97.93%;而在不同骨折分型诊断方面,准确率为80%~95%。
基于MRI影像的智能辅助诊断 MRI检查不仅可以用于 OVCF的诊断,而且在评估骨折愈合情况以及区分新鲜和陈旧性骨折方面也体现出十分重要的临床价值。Ger mann等借助CNN对MRI影像数据进行处理,实现对椎体前后高度、椎体终板凹陷程度及椎体角度等关键参数的自动测量。研究结果表明,该模型在椎体各项参数的测量结果与放射科医生具有极高的一致性,其组内相关系数均超过94%;而在 OVCF诊断工作中,该模型表现出的灵敏度和特异度分别达到94%和97%,体现出较高的诊断效能。Yabu等构建了一种基于 CNN 的 MRI自动检测模型,用于新鲜与陈旧性 OVCF的鉴别诊断,该模型在验证集上所取得的诊断准确性 AUC值为0.95,其诊断准确性水平可与经验丰富的脊柱外科医生相当,同时还能明显降低对陈旧性骨折的误诊率,从而为骨质疏松症患者的动态病情监测以及个体化治疗方案优化工作提供切实可行的技术支持。
借助人工智能技术开展的 OVCF智能辅助诊断工作,目前已展现出较为广阔的应用前景以及突出的临床价值,在影像识别、骨折分度评估以及临床辅助诊断等关键环节中的实际表现,与放射科或骨科医师相比,整体处于接近水平,诊断准确率也维持在较高水准。尽管围绕这一方向所展开的相关研究工作一直在持续不断地向前推进,但真正完成临床转化并且已投入到日常诊疗实践使用的智能辅助诊断系统数量仍相对有限。后续应进一步强化不同学科之间的协作配合,组织开展设计严谨、实施规范的高质量临床试验,以此对人工智能辅助诊断模型的可行性以及在不同医疗场景下的通用性进行系统性验证,并且加快推动这类模型在真实临床诊疗流程中的落地与推广(见表1)。

展望与挑战
人工智能技术可以辅助临床医生开展更为精准、更为高效的 OVCF识别工作,以及高骨折风险人群的筛查工作,从而推动了智慧医疗在 OVCF诊疗这一领域的快速发展。然而,尽管人工智能在 OVCF诊疗中的应用前景十分广阔,但它在临床实践当中的推广应用仍面临着不少实际挑战,亟需进一步研究与优化。
模型可解释性的不足 目前所采用大部分人工智能模型,其结构普遍呈现出较为复杂的非线性特征。鉴于这类模型本身带有“黑箱”属性,使整个预测过程在透明度上明显不足,也就难以对其诊断结果提供清晰、可信且易于理解的解释。这种缺乏可解释性的状况,在临床应用中会影响医生与患者双方对相关诊断结果的接受度,同时也在很大程度上限制了人工智能模型在临床诊疗工作中的进一步推广和应用。Shen等创新性地提出了一个能够定量反映椎体压缩程度的指 标-面 积 损 失 比,参 考 Genant半 定 量 评 估 法 的 操 作 流程,并将其转化为明确数值表达的量化指标体系。这项工作不仅在一定程度上克服了传统临床人工判读方式所固有的主观性局限,同时也使相应算法的可解释性水平以及临床一线人员对其的认可程度得到了切实提升。Zhang等选用多尺度注意力引导网络(MAGNet)开展 OVCF诊断任务,并且借助多头自注意力机制,实现了对椎体骨折区域的可视化图像呈现,使该算法网络在运行过程中能够把注意力更多地集中在图像中与骨折相关的细微结构上。
虽然注意力图技术能够把重点区域的图像展示出来,从而在一定程度上增强模型的可解释性,但对于较小的骨折病变,模型所关注的区域是否与临床医生在诊断过程中所依据的关键特征相契合,以及这种对细节的突出呈现方式究竟能否转化为明确且可信的临床证据,仍然需要开展更为深入的验证工作。后续的研究工作应当继续加强对先进可视化技术的开发,并且把这类技术切实运用到实际分析中,以此来提高模型的可解释性以及整体透明程度,进而提高临床医生对于人工智能诊断结果的采纳程度以及实际使用意愿。
临床应用效能的验证不足 目前有关智能辅助诊断方面的研究,重点多放在模型构建以及算法性能验证这两个方面。然而,针对算法在真实临床应用场景当中实际应用效果的评估性研究相对较少;并且,大部分已有的研究要么缺少外部验证集的支持,要么尚未开展真实世界研究层面的验证工作,使得部分人工智能模型尽管在既定测试环境中呈现出较为理想的结果,但其在具体的临床实践中难以真正落地推广,也很难切实有效地应用于日常的临床诊疗 工 作 中。因此,有必要依托多中心协作机制和大规模样本量的真实世界数据,系统性地推进临床验证相关研究,对人工智能系统在提高诊断准确性、缩短诊疗时间、改善患者预后等方面的实际成效进行综合评估,从而为后续模型的持续优化以及临床应用推广提供坚实的循证支持。
图像数据的复杂性和异质性 相较于其他类型的骨折,OVCF在影像学检查中所表现出来的征象往往较为细微且形式多样,尤其是在疾病处于早期阶段或者骨折程度较轻的情况下。X线片虽然在临床实践中具有普及范围广、适用场景多等方面的优势,但它对于骨折早期各类征象的敏感程度相对有限,并且在对新鲜骨折与陈旧性骨折诊断过程中也存在一定困难。CT影像在识别骨结构细节方面具备更强的能力,能够反映出更为精细的骨组织形态变化,然而面对由退行性改变、肿瘤病变或者感染因素所引发的椎体结构异常时,常常难以准确识别。MRI影像尽管在检测骨髓水肿这一关键征象方面效果较为理想,但也伴随着检查费用偏高、整个检查过程耗时较长等现实层面的局限性。因此,如何更加合理地开展这些来源不同、特性各异的影像数据的整合工作,并且在此基础上推进能够处理多模态影像及高分辨率图像的深度学习模型的研发,从而提高 OVCF诊断结果的特异性和准确性,成为当前相关研究领域当中亟需应对和解决的一个重要课题。
罕见或特殊类型 OVCF的诊断困难 对于那些发生率较低、临床表现不够典型的 OVCF病例,像隐匿性骨折、合并脊柱肿瘤等情况,目前用于模型训练的数据相对有限,这使得深度学习模型在识别其影像学特征方面有一定的难度,进而对模型整体的泛化能力以及最终诊断结果的准确性造成一定影响。因此,如何借助小样本、迁移学习等技术手段应对罕见病例所面临的数据量不足的问题,从而进一步提升模型对各类复杂 OVCF开展诊断工作的能力,已成为后续研究中一个十分关键的方向。
综上所述,随着人工智能技术的快速发展,其在 OVCF诊疗这一专业领域中展现出广阔的应用前景,并在 OVCF早期诊断、风险预测以及治疗决策等多个关键环节当中发挥重要作用,从而为各类医疗机构提供更为精准、可靠的诊疗辅助,进一步推动 OVCF临床诊疗工作由传统医疗模式逐步迈向智慧医疗的新阶段。
来源:实用骨科杂志2026年4月第32卷第4期