作者:罗开慧,田而慷,四川大学华西口腔医学院;李娟,四川大学华西口腔医院正畸科
深度学习(deep learning)是基于神经网络(neural networks,NNs)构建的一种特征学习方法,在图像分类、分割、定位及多目标检测等领域具有显著优势;有研究对其在口腔医学领域中的作用进行探索,研究对象包含多种口腔科图像(如牙合翼片、根尖片、曲面体层片等)。口内数码照片由于获取方便、成本低廉、无辐射损害及诊断直观等特点,可作为诊断口腔疾病的重要工具。拍摄标准口内数码照片需使用微距摄影镜头及闪光灯,配以拉钩、反光板等来暴露口内目标区域,要求图像清晰、曝光适宜及色彩还原基本准确;其在临床资料留存、医患医技沟通、疾病诊断及科研等方面具有重要作用。
但由于口腔疾病种类繁多、地区医疗资源分布不均,以口内数码照片为主要资料进行人工诊断耗时耗力。若将基于口内数码照片的深度学习应用于口腔疾病的诊断中,可有效解决上述问题。本文对基于口内数码照片的深度学习在牙体疾病、牙周疾病、口腔黏膜病及
1. 牙体疾病
1.1
龋病是牙体硬组织发生进行性破坏,表现为牙体组织的色形质改变;临床上对龋病的诊断主要依靠视诊、探诊及X线检查,但探诊需额外工具,且X线检查对早期龋的诊断能力有限。因而,视诊是诊断龋病较为简单直接的方法。
有学者研究了基于口内数码照片的深度学习在龋病诊断中的应用潜力。其中,李若竹等通过VoTT软件(Windows 2.1.0,Microsoft,美国)对712张口内数码照片中不同牙齿及龋坏类型的9014个数据集进行标注后训练;结果显示,诊断洞龋的灵敏度为0.960、特异性为0.970,窝沟龋的灵敏度为0.958、特异性为0.990,邻面龋的灵敏度为0.881、特异性为0.971。其他研究在降低口内摄片质量、提升算法精度及细化龋病诊断要求等方面进行了探索。
Zhang等对深度学习模型的类型进行探索,发现Faster-RCNN的疾病诊断能力优于Single Shot MultiBox Detector(SSD),但SSD耗时明显短于Faster-RCNN。Park等发现卷积神经网络(convolutional neural networks,CNN)对牙齿表面进行分割后,龋齿图像分类、定位算法的性能皆得到改善,分类算法的准确率由0.756提高到0.813。
虽然各项研究均具有较高的灵敏度和特异性,但在研究质量方面,部分研究未能提供龋齿样本的临床检测相关数据,且未对龋坏面积及龋病严重程度等进一步诊断,还需更深入研究。
1.2 牙体硬组织非龋性疾病
牙体硬组织非龋性疾病包括牙发育异常(如牙釉质发育不全)、着色牙(如氟斑牙)、牙形态异常(如过小牙)等。然而,临床医生有时难以区分某些牙体硬组织疾病,如牙釉质白斑可能是氟斑牙、龋病(如正畸后早期龋)或矿化不全等导致。有研究通过基于口内数码照片的深度学习来对其进行诊断。Askar等收集了434张口内数码照片,并通过深度学习模型来鉴别诊断牙釉质白斑,准确率较高,为0.81。
Alevizakos等基于口内数码照片的深度学习来鉴别诊断龋齿、牙釉质矿化不全、牙釉质发育不全和氟斑牙,并对5种不同CNN模型(ResNet34、ResNet 50、AlexNet、VGG 16及DenseNet 121)的诊断性能进行比较,发现VGG 16的精确率(0.8398)最低,DenseNet 121的精确率(0.9286)最高;且不同深度学习模型对不同疾病的诊断准确率也不同,VGG 16对牙釉质发育不全的诊断准确率(0.547)最低,而ResNet 50对龋齿诊断准确率高达1.000。
牙体硬组织非龋性疾病种类众多,深度学习在口内数码照片中的应用可较好地弥补临床医生漏诊的问题。但牙釉质矿化不全及氟斑牙等疾病的诊断受唾液及拍摄光线等影响,因而应提高口内数码照片质量,如提高分辨率及尽量避免唾液污染等。
2. 牙周疾病
牙周疾病是一种慢性牙周炎性疾病,包括牙龈炎和牙周炎,全球20%~50%的人群受牙周疾病的影响。目前,牙周疾病的诊断方式主要为牙龈组织是否红肿、评估口腔卫生状况(尤其是对牙菌斑和牙结石的评估)、牙周探诊检查及影像学检查。有研究根据牙龈组织红肿等特征,通过口内数码照片的深度学习来诊断牙龈炎和牙周炎。
Li等基于800张口内数码照片的深度学习来诊断牙龈炎,其灵敏度和特异性分别为0.7823、0.7817。Alalharith等、Ariandi等及Chen等同样探讨了基于口内数码照片的深度学习在牙龈炎诊断中的作用,准确率均超过0.7。与牙龈炎相比,牙周炎由于存在附着丧失及牙槽骨吸收而诊断更加困难,此时需结合其他特征。
Balaei等尝试通过口内数码照片是否存在牙龈红肿、黑三角及牙根暴露来诊断牙周炎,其准确率为0.667,低于深度学习在根尖片及曲面体层片中诊断牙周炎的准确率(0.767~0.810)。另外,牙结石与牙周疾病密切相关,检查牙菌斑及牙结石可辅助其诊断。Li等基于625例患者的3932张口内数码照片进行深度学习,发现其检测牙龈炎、牙结石和软沉积物的曲线下面积(AUC)分别为0.8711、0.8011和0.7857。
由此可见,基于口内数码照片的深度学习可较好识别牙龈炎及牙菌斑和牙结石等牙周疾病相关因素;但由于拍摄角度的因素,其难以检测到牙龈退缩和牙结石堆积的隐蔽位置(如下颌舌侧等),因而对拍摄技术及辅助工具(如反光板)等提出了更进一步的要求。
3. 口腔黏膜病及口腔癌
口腔黏膜病在我国老年人群中发病率为23%,可导致患者的生活质量及身体机能下降。Gomes等通过5069张口腔黏膜数码照片来比较ResNet-50、VGG16、InceptionV3和Xception这4种架构方式对6类口腔黏膜基本病变(丘疹或结节、斑或斑点、疱或大疱、糜烂、溃疡及斑块)的分类诊断能力差异,发现使用基于InceptionV3的架构分类诊断性能最佳,平均准确率为0.9509,平均灵敏度和平均特异性分别为0.9705和0.8632。
口腔黏膜病中,口腔扁平苔藓(oral lichen planus,OLP)和口腔白斑(oral leukoplakia,OLK)等属于口腔潜在恶性疾病(oral potentially malignant disorders,OPMD),易发展为口腔癌。视诊和触诊可在早期阶段发现OPMD和口腔癌,有学者应用基于口内数码照片的深度学习对口腔黏膜病及口腔癌进行诊断。管子玉等和Keser等基于不同深度学习模型的图像分类或图像分割功能,成功通过口内数码照片对OLP和OLK进行诊断。Fu等收集并随机选取了正常黏膜和口腔
Song等、Warin等及Jeyaraj等研究同样验证了深度学习在口内数码照片中分类和诊断口腔癌及OPMD的潜力。其中,Warin等与Jeyaraj等对不同数据处理模型的性能进行比较。Warin等采用DenseNet-169、ResNet-101、SqueezeNet和Swin-S为图像分类模型,采用Faster R-CNN、YOLOv 5、RetinaNet和CenterNet 2为目标检测模型,发现DenseNet-169性能最佳。Jeyaraj等则将CNN与支持向量机(support vector machine,SVM)等传统分类技术对比,发现CNN性能更佳。此外,由于恶性病变较良性病变具有更明确的特征,因而深度学习模型在识别恶性病变时准确率更高。
口腔黏膜病种类众多,部分疾病特征相似,若将病史采集、影像学检查及病理学检查的深度学习应用于该疾病的诊断中,将会显著提高口腔黏膜病和口腔癌的诊断准确率,这将弥补由于地区医疗资源有限带来的漏诊等问题。目前研究多通过口内数码照片来对疾病进行诊断,少有研究能够在图像中精准识别病灶的具体部位或明确病灶边界,还需更大样本量的研究以使其在准确诊断疾病的同时实现病灶的准确定位。
4. 结语
基于口内数码照片的深度学习诊断口腔疾病准确率高,具有非侵入性、经济成本低、易于使用及不受临床医生主观性和经验水平影响的独特优势;且相关研究表明,其诊断口腔疾病的准确率不亚于临床医生。此外,基于口内数码照片的深度学习在口腔修复领域也有一定的诊断作用。Engels等收集了1761张口内数码照片,应用深度学习对未修复牙、树脂修复体和陶瓷修复体等进行分类和诊断。Signori等和Takahashi等研究同样表明,基于口内数码照片的深度学习在口腔修复体的识别和诊断方面效果较佳。上述研究利于对治疗后的修复体进行检查,并可追踪其远期治疗效果。
深度学习模型种类繁多,应根据数据的不同特点来选择适宜的模型。相较于人工神经网络(artificial neural network,ANN)、SVM等深度学习模型,各式各样的CNN在医学图像分析中更为常用,性能更佳且不断优化,如Faster R-CNN在R-CNN基础上,对目标检测速度和准确率进行了优化;DenseNet-169和ResNet-101作为大型架构,在图像分类等领域表现出优越性能,甚至可优于临床医生;SqueezeNet、Swin-S及SSD等小型架构特别适用于在较小数据集上进行训练,可被开发为诊断口腔疾病的移动应用程序。
目前已有研究中,基于口内数码照片的深度学习虽然表现出较高的准确率、灵敏度和特异性,但仍存在一定不足。在研究质量方面,研究受到样本量、口内数码照片本身的局限性、口内数码照片质量(如分辨率、是否有唾液污染及光源等)、诊断的一致性及模型性能的评价指标等影响,研究质量参差不齐。在研究内容方面,目前的研究局限于单种或几种口腔疾病,数据模块单一,且难以构建多学科口腔医疗数据分析体系。
在研究方法方面,多为图像分类研究,少数为分割、目标检测研究,且多为二分类问题(即有或没有),并未对疾病的严重程度等指标进行深层次的研究。在性能评价指标方面,评价指标不统一,多数研究将准确率、灵敏度、特异性及AUC作为深度学习模型性能的评价指标,部分研究采用F1值(精确率和召回率的调和平均值)及精确率(阳性预测值)等评价指标;尽管相关数据可通过一定方法换算,但仍然导致各个研究之间难以进行直观的横向比较。综上,受样本量及研究异质性的限制,基于口内数码照片的深度学习诊断口腔疾病的性能还需进一步提高。
随着深度学习理论和技术日趋成熟、数据集质量的提高、研究规模的扩大、诊断标准及评价指标的统一,深度学习将会更加深入广泛地应用于口腔疾病的诊断中。不同口腔科图像数据集(如口内数码照片、曲面体层片及根尖片等)的相互结合,可帮助构建多维度口腔医疗数据分析体系;其可有效完善口腔疾病诊断系统,夯实精准医疗的发展及应用。
来源:罗开慧,田而慷,李娟.基于口内数码照片的深度学习在口腔疾病诊断中作用研究进展[J].中国实用口腔科杂志,2024,17(02):228-234.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)