作者:海军军医大学第二附属医院长征医院颈椎外科 周俊昊
脊髓型颈椎病(DCM)是以颈椎结构性退变压迫脊髓神经为特征的常见颈椎病类型。流行病学研究发现,约有2%的成年人患有DCM,但临床确诊率只有不到10%,除此之外,高达24.2%的脊髓受压人群无明显症状,如果未能进行早期干预,可能导致脊髓损伤加重,影响生活质量,严重时甚至可能导致身体残疾。人工智能(AI)被誉为第4次工业革命的潜在催化剂,耳熟能详的机器学习(ML)、深度学习(DL)和ChatGPT都是AI家族中的一员。随着计算机算力提升和模型算法的升级,AI在疾病诊疗中的应用越发广泛深入,AI在DCM诊疗中的应用研究也是层出不穷。对此,笔者以“DCM”“AI”等关键词在Pubmed、知网等医学文献数据库进行检索,从AI在DCM医学影像识别、疾病诊断、治疗决策和预后等方面,综述AI在当前DCM诊疗应用现状以及未来发展方向。
人工智能在颈椎影像中的应用
X线片、CT和MRI等是识别颈椎解剖结构、发现病理改变的重要检查手段,但是人工影像分析不仅耗时耗力,还存在观察者间差异,而AI自动识别模型效率高,标准相对统一。颈椎解剖结构的精确分割和识别是AI辅助颈椎病诊断和治疗的基础和关键,随着计算机技术的更新迭代,分割识别模型与方法也在不断发展。早在2000年代,颈椎影像自动分割技术便开始萌芽,受限于计算机能力和分割数据的可用性,分割方法较为初始,应用较为广泛的算法包括强度阈值法、区域生长法和启发式边缘检测算法等。Antani等在技术上建立了AI辅助分割和识别颈椎结构的雏形,他们在自动获取基本标志点信息、获取脊柱位置和方向、确定椎体边界以及对存在骨赘的椎体形状进行分类等方面取得了一定进展。ML的出现促使算法模型从传统手动分割方法向基于数据的自动化分割方法转变。Huang等运用改进的AdaBoost算法来提高脊椎检测的效率和准确性,该自动化脊椎检测和分割方法的脊椎检测率及分割准确率达到近98%和96%。卷积神经网络(CNN)在处理复杂影像任务方面表现出卓越的能力,U-net模型的出现更是展现出DL应用于医学影像识别的巨大潜力。
Cheng等利用DL方法通过两阶段Dense-U-Net建立了自动椎体定位和分割模型,该模型对于椎体骨折检出率高达100%,分割的Dice系数为0.953±0.014。经过二十多年的发展,AI在颈椎影像中的应用从原始单纯生物学标记进化到广泛研究的混合可解释模型,AI与颈椎影像的交叉融合,不仅显著缩短了影像可视化分析时间,还提升了影像评估的可靠性和标准化水平。颈椎影像上的测量指标如Cobb角、颈椎曲度、脊髓最大受压程度等可以帮助颈椎外科医生判断DCM严重程度,并辅助作出治疗决策。相较于传统人工测量,AI自动识别标注模型能够显著提高效率、一致性和准确性,降低成本和人力需求。Wang等开发的MultiIA-UNet自动检测模型,可以精准测量每个节段的Cobb角,测试结果发现,模型与人工测量之间的一致性较高(ICC为0.76~0.95)。Merali等收集了289例手术的DCM患者术前影像,训练并测试了DL模型用于检测颈椎MRI中的脊髓压迫,测试后得出模型的AUC是0.94,敏感性是0.88,特异性是0.89,以及F1分数是0.82。马超等采用CNN模型对脊髓和脑脊液、椎管进行自动化分割,通过计算改良后最大管道压迫程度和脊髓占用比,实现对颈椎管狭窄和脊髓受压程度的量化。
人工智能在脊髓型颈椎病诊断中的应用
DCM的诊断主要依靠患者神经症状以及医生对颈椎影像资料的判读,DCM患者常表现为肩颈疼痛、上下肢运动功能障碍、步态失调、膀胱或肠道功能障碍等,症状学上存在异质性,而正是这种异质性阻碍了DCM的早期诊断。Munro等从患者群体角度对DCM的症状进行了全面描述,并且建立了完整的数据集,Touzet等通过使用K均值聚类法对数据集进行聚类分析,根据临床特征将参与者分为了3簇,3簇患者在临床症状上各不相同,但是在DCM严重程度以及患病时间上没有统计学差异。这项研究提示,ML在从临床症状中识别DCM存在可能,但是此项研究存在样本量小、信息有限、数据集单一等局限性,未来需要创建高质量、多样化的大型疾病数据集。在影像辅助诊断DCM方面,Hopkins等纳入13例DCM患者和15名正常人,获取他们的颈椎MRI影像资料后构建了诊断预测模型,模型诊断正确率高达90%,平均AUC为0.947,平均敏感性为90.3%,特异性为85.1%。尽管此研究样本量较小,但这项研究也展现了ML在仅基于影像特征预测DCM的可行性和潜力。虽然单纯基于临床症状和颈椎影像的诊断模型诊断正确率较高,但是相关研究数据集存在质量不佳、样本量小、模型泛化能力不足的问题,笔者认为综合患者颈椎影像和神经症状的多模态大模型是AI在DCM诊断中应用未来发展趋势。AI在DCM中的影像学诊断应用中主要依靠对病变区域的识别与分级,不同影像对于颈椎病变区域的诊断效能不同。虽然MRI和CT检查已被广泛使用,可这两种检查方式费用高,X线片检查仍然是颈椎疾病筛查的主要手段。但是X线片对于软组织的对比度较差,同时X线片提供的是二维影像,可能导致结构重叠掩盖或模糊病变细节,影响诊断准确性。
DL可以辅助医生在X线片上诊断DCM,有效提高DCM在X线片上的诊断正确率。Lee等收集了96例DCM患者与201例非DCM患者的X线片资料,使用影像对CNN模型的训练和测试,结果发现,模型的准确率为87.1%,AUC为0.864,证明了使用单张侧位颈椎X线片的CNN模型,在诊断DCM中的可行性。Tamai等使用来自240例患者的影像资料构建并测试了一个基于EfficientNetB2的CNN模型,结果显示,算法在独立测试数据集上的诊断准确性和AUC均为0.81,算法在X线片上对脊髓受压识别的准确性也高于每位颈椎外科和影像科医生,证明X线片在AI算法的辅助下可以作为DCM的筛查工具,以减少临床MRI的需求,降低医疗成本。除此之外,他们还使用486例患者的影像数据创建DL算法模型,结果显示,模型对后纵韧带骨化总体诊断准确性为0.88,AUC为0.94,而且算法模型诊断准确率显著高于脊柱外科医生。但是此项研究只纳入了日本地区的患者,模型泛化能力有限,且该模型无法精准区分骨化韧带和骨赘,高精度诊断模型亟待开发。Chae等开展了一项类似研究,该模型不仅在颈椎整体进行了识别分析,还在每个椎体层进行了识别,结果发现,模型在对于节段型和局灶型后纵韧带骨化诊断效果不佳,但对颈椎层面和其他类型后纵韧带骨化的识别能力明显优于人工。笔者认为,该研究虽然未显著提高DL模型后纵韧带骨化总体诊断能力,但是细化了AI在识别不同类型后纵韧带骨化的应用,为后续AI对后纵韧带骨化的研究提供了新方向。
人工智能在脊髓型颈椎病治疗决策和预后预测中的应用
DCM患者的症状和严重程度各不相同,从轻微的感觉神经病变症状到伴有功能障碍的运动无力,具体临床表现取决于疾病的进展和严重程度。DCM患者需要早期诊断和管理,必须根据疾病的严重程度选择合适的治疗方案以尽量减少对脊髓的损害。Kadanke等进行的一项针对轻度至中度DCM患者(mJOA评分>12)的随机对照研究,发现手术治疗并不优于保守治疗,但其他研究表明,更严重的DCM患者在手术治疗后功能恢复更好。Feh⁃lings等认为中度至重度DCM需要早期诊断和手术治疗,他们也指出在轻度DCM的治疗选择上存在空白。同时,关于决定进行手术的DCM患者的最佳手术方法的研究也有报道,一些研究比较了DCM前路和后路手术,但迄今为止尚未有充分证据证明何种手术更具优势。在神经恢复方面,手术方法之间没有明显差异。因此,关于DCM的治疗决策存在争议。临床上,手术指征可能因外科医生的实践风格、偏好和医疗保险制度而略有不同。AI算法可以处理大量样本的数据,在分类和预测方面也有着优异表现,这意味着它们可以被应用于医学决策研究。Park等收集了304例DCM患者的基本信息、临床功能评分、影像学和电生理检查结果,利用这些信息进行了基于ML算法的集成分类,包括保守治疗、前路手术和后路手术,并以一位资深的神经外科医生的决定作为患者治疗方式的金标准。结果显示,三分类模型中RF和XGB两种模型的AUC分别为0.91和0.92,保守治疗和手术治疗以及前路手术和后路手术的二分类模型AUC也均>0.9。
目前,AI在DCM治疗决策中应用模型研究较少,大多数研究停留在对手术患者预后以及不同术式患者术后情况预测模型的建立。Khan等采用7种ML模型对193例轻度DCM手术患者术后1年随访时改善情况进行预测,证明ML模型可以预测轻度DCM患者的术后恢复情况,可以识别哪些轻度DCM患者从手术中获益最大。2024年,Song等回顾分析了来自3个独立医疗中心的406例DCM手术患者数据,使用JOA评分评估患者术前和术后1年的神经功能状态,比较了多种ML模型的预测性能,发现支持向量机算法模型表现最佳,其AUC达到0.93,准确率为86.4%。前路颈椎间盘切除融合术(ACDF)是临床上的热门术式,术后并发症和功能恢复情况是广大研究者关心的问题。早在2018年,Arvind等纳入了多中心20879例ACDF手术患者,比较了各种机器模型在预测术后并发症方面的表现,发现人工神经网络和逻辑回归模型在所有并发症的预测中都优于美国麻醉师协会制定的体格情况分级。Rudisill等开发并验证一个预测ACDF后早期邻近节段退变的模型,这项研究纳入了366例ACDF术后患者,发现模型在预测术后早期邻近节段病变方面表现良好,AUC为0.794,准确率为0.82。除了常见的ACDF术式外,其他术式的预测也被广泛研究。Karabacak等建立了一个可解释的ML模型来预测后路颈椎融合术(PCF)术后短期预后,该研究纳入了6277例PCF手术患者,发现术后非家庭出院预测最为准确,平均AUC为0.812,准确率为81.5%。基于此项研究,他们开发了一个在线预测工具,允许用户基于患者特征预测术后结果,实现了模型的临床应用。无论是决策模型还是术后预测模型,两者都是退行性脊柱疾病背景下个性化医疗的基础。决策模型可以通过分析患者基本信息、临床表现等作出专家级治疗决策,可以减小地区间医疗差异,同时提升社会整体医疗水平。不同颈椎手术后并发症、神经恢复情况等预后预测模型可以帮助制定个性化的术后管理方案,同样也可以辅助临床医生作出合理治疗决策。
总结和展望
在DCM的诊断和治疗中,AI的应用虽然展现了显著潜力,提高了疾病的诊断率、提升了地区医疗水平,一定程度上减少地区医疗不平衡,但仍存在一些缺陷和需要完善的方面:(1)大部分研究是单中心研究,数据量小且单一,此类数据训练出来的模型泛化能力有限,难以适应不同医院、不同设备、不同人群的差异性。对此,未来应建立多中心合作的数据共享平台,以获取高质量和多样化的数据;(2)许多AI模型,特别是DL模型,往往是“黑箱”模型,难以解释其决策过程。在医疗应用中,提高模型的可解释性至关重要,以便医生能够信任和验证AI的诊断和治疗建议;(3)尽管AI模型在实验室环境中表现良好,但在实际临床环境中的验证和应用仍然不足,需要进行更多的临床试验来验证AI模型的有效性和可靠性;(4)目前应用于DCM的AI模型主要还是依靠提取病历信息、影像数据等其中单独一种信息进行模型构建,缺少多模态信息整合。通过整合和分析多种类型的数据,可以提高诊断的准确性、优化治疗方案,并推动个性化医疗的发展。AI是一种强有力的辅助诊疗工具,尽管在DCM中的应用仍处于起步阶段,面临诸多问题,但其发展前景广阔,相信在计算机领域和颈椎外科专家的共同努力下,未来可解释、可靠的AI大模型可以应用在DCM诊疗中的各个环节。
来源:中国矫形外科杂志2026年1月第34卷第2期
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)