作者:首都医科大学口腔医学院口腔颌面头颈肿瘤外科(刘江华、冯芝恩),儿童口腔科(张姝)
人工智能(artificial intelligence, AI) 在1956 年由John 等首次提出, 其中机械学习(machine learning, ML) 及其子集深度学习(deep learning, DL)是开发基于图像诊断和治疗颌骨囊、实性疾病工具的主要方法。在颌骨囊、实性病变的诊疗过程中,X 线检查是重要的辅助检查,可成为开发用于颌骨囊、实性疾病诊断AI 工具的重要突破口;同时在颌骨囊、实性疾病诊疗过程中收集的影像资料,可成为开发训练AI 模型的丰富数据源,其中电子计算机X 线
1.机械学习
ML 是AI 的子领域,它使算法能够在不被明确编程的情况下学习一组数据的内在统计模式,对不可见数据进行预测。它是AI 的核心,也是使计算机具有智能的根本途径,其中人工神经网络(artificial neural network, ANN) 是目前最流行的ML 模型之一,它模仿生物神经网络结构,通过设计、组装并连接人工神经元,调整内部节点之间相互连接关系来解决图像分类诊断或智能分割等特定任务。
2.深度学习
DL 是ML 的一个子集,专门使用多层人工神经网络来学习具有多个抽象层次的数据表示。DL算法经过训练,可以自动提取复杂数据中的分层特征并优化加权参数,从而实现更高效的学习过程并最大限度地减少预测误差。在DL 中,卷积神经网络(convolutional neural network, CNN)是一类人工神经网络,经常用于图像相关任务,例如2D 和3D 图像中复杂模式的自动检测、分割和分类。基于DL 自动配置的医学影像分割方法相比于传统的CNN 算法,增加了3D 卷积,在颌骨囊、实性疾病的识别、分割等方面有了更进一步的优化。
3.人工智能与颌骨结构及病变的识别
曲面断层片和CBCT 成像范围包括整个上、下颌骨,并延伸到上、下颌骨以外的区域,能显示牙齿、牙胚、下颌神经管、颏孔、上颌窦等正常结构以及颌骨病变的大小、位置等。因为口腔颌面部结构多且复杂,在曲面断层片中会受患者
Yang 等在评估实时物体检测深度卷积神经网络You Only Look Once(YOLO) v2 的诊断性能研究中发现YOLO 能够检测到、并正确分类临床医生未能识别的病变(包括1/3临床医生未能正确识别诊断的上颌骨牙源性角化囊肿和下颌骨含牙囊肿),但对于面积比较大的囊性病变,可能被认误诊为骨缺损,出现假阴性结果。
4.人工智能与颌骨囊、实性疾病的诊断
颌骨囊肿和肿瘤在影像学上通常表现为类圆形低密度影像,在病变较小时不会显示其独特的影像学特征,难以诊断;但不同病理类型的病变在生物学行为上有所差异,治疗策略也不同。因此,手术前如何诊断和区分病变类型非常重要。
Kwon等开发的检测和分类牙源性囊性病变的CNN 模型,使用1200 余张病理活检结果与影像学诊断相同的曲面断层影像对CNN 进行训练和验证,纳入的疾病类型囊括了含牙囊肿(350 张)、根端囊肿(302 张)、成釉细胞瘤(230 张)、牙源性角化囊肿(300 张)和正常人曲面断层片(100 张),以病理结果作为金标准,结果该模型分类诊断病变的准确性达到0.91,说明该CNN 模型能够辅助临床诊断。
Li 等 回顾性收集成釉细胞瘤和牙源性角化囊肿患者的数字全景片1000 张,其中800 张用来训练包括ResNet、VGG、EfficientNet 在内的8 种CNN模型,200 张用来比较不同CNN 模型的性能。此外,7 名口腔放射科医生(包括2 名高级和5 名初级)也对用来测试的200 张数字全景片进行诊断,并将CNN 与口腔放射科医生的诊断结果进行比较,结果发现,8 个神经网络模型诊断准确率均在82.50%~87.50% 之间,不同CNN 模型的诊断准确率在训练集(P=0.998) 和测试集(P=0.905) 均无显著性差异,且CNN 模型的诊断准确率高于口腔放射科医生10% 以上(P<0.001)。
Chai 等收集178例成釉细胞瘤和172 例牙源性角化囊肿的CBCT 资料,训练CNN 模型并将其诊断性能与口腔颌面外科医生进行比较,证实CNN 模型诊断准确性方面比临床外科医生要约20%。Liu 等也证实了基于迁移学习算法的CNN 结构可以显著提高成釉细胞瘤和牙源性角化囊肿鉴别准确度,在训练集、验证集和测试集的AUC 分别可达0.998、0.966 和0.946,且单个图像的平均预测时间为0.15 s。
DL 模型能够在疾病早期阶段做出诊断,特别是恶性病变,有助于早诊断、早治疗。由于CBCT 在描述病变区域每个体素有更多定量特征方面的优势,基于CBCT 图像训练的模型优于基于曲面断层片的模型。
5.人工智能与颌骨结构及病变的分割
当前,AI 器官分割研究中,最常应用的算法是CNN。通过使用大量的CBCT 图像数据集进行训练,可准确地分割出颌面部解剖结构。研究表明,使用CNN 算法进行颌骨解剖结构的分割,其Dice 相似系数(dice similarity cofficient, DSC)可达90% 以上,平均对称表面距离(average symmetric surface distance, ASSD)可达0.3 mm 以下。在颌骨囊性病变分割方面,使用 CNN 算法可有效地分割出颌骨囊性病变的区域,其DSC 系数和ASSD系数可达到 80% 以上和2 mm 以下。
Oliveira 等发现AI 工具可以帮助临床医生自动分割神经血管及其解剖变化。Fontenele 等训练开发了一个基于CNN 的CBCT 图像三维牙槽骨自动分割工具,并比较该CNN 模型与人工分割上颌牙槽骨及其顶部轮廓的精度与效率,虽然人工分割显示略好的性能,但 CNN 模型也提供了上颌牙槽骨及其牙槽嵴轮廓的高精度分割,所需时间比手动方法减少116倍;同时AI 工具对低密度骨解剖结构往往分割不充分,如牙槽骨和
对于口腔内密度较高的金属植入物( 如种植体、金属冠、正畸托槽等) 产生的伪影,曾维等通过构建CT 影像消除GAN 模型进行消除,大幅提升了图像质量。唐丽等尝试以DLR 联合Smart MAR 算法重建口腔金属植入物患者颈部CT 图像,结果图像的噪声、AI 值、图像整体质量及显示病灶质量均较好,但存在无法去除金属伪影的可能。未来仍需针对金属伪影开发适用性更广的AI 模型来完成影像重建和病变分割。
6.局限性
总体来说,AI 在颌骨囊、实性疾病识别与诊断的准确度、效率上表现出了优势,但在研究和临床应用方面仍有局限性。首先,研究人员难以在AI 发生错误后对模型进行有效算法改进,是AI 在口腔疾病影像学应用中的最大障碍。其次,AI模型训练时往往使用在某个时点、单中心的影像资料,并使用同一中心样本验证,样本量有限,均导致训练模型的过度拟合。当将研究结果外推时,模型外部验证性能常较差,具有较大的不稳定性。
最后,神经网络的权重连接系数作为AI 建立模型的算法基础,导致新的网络训练模型会调改甚至删除旧训练模型的学习结果,且无定向性并具有一定的随机性。最后,AI 在存在金属伪影或影像质量差的情况下表现也会受到影响。AI 在口腔医学中的应用拥有巨大潜力,是进一步提高颌骨疾病诊断率,打破临床、影像与病理等辅助检查之间的数据壁垒,开发自动诊疗专家模型的重要手段。在诊断、制定治疗方案、预后预测等临床场景中,与虚拟现实和增强现实等技术融合已成为未来发展方向。
来源:刘江华,张姝,冯芝恩.人工智能辅助颌骨囊实性疾病识别与诊断的研究进展[J].北京口腔医学,2025,33(02):135-137.DOI:10.20049/j.bjkqyx.1006-673X.2025.02.014.