作者:唐灵儿,王妍,北京大学第三医院妇产科国家妇产科临床研究中心国家产科专业医疗质量管理与控制中心,北京大学医学部
电子
人工智能的发展历经专家系统和机器学习,后者包括传统机器学习和深度学习。为了使针对CTG的临床决策更为客观,学界进行了专家系统即计算机化CTG(computerized CTG,cCTG)研究。随着大数据时代的到来,基于机器学习的CTG人工智能分类诊断技术成为了研究热点。相较于专家系统,机器学习具备利用样本进行归纳演绎的能力,其智能程度更高,前景更为广阔。目前,机器学习在产前CTG分类判读中的应用已有诸多研究。本文回顾了机器学习在产前CTG三分类判读中的应用与判读效果,旨在为产前CTG机器判读的进一步发展提供参考。
1 CTG判读发展
20世纪80年代,国际妇产科联盟(InternationalFederation of Gynecology and Obstetrics,FIGO)指南提出CTG图形包括胎心基线、基线变异、加速、减速4个基本特征,并以此为据将CTG图形分为反应型、可疑型和无反应型。通过CTG图形分类判断胎儿宫内状态对临床医师具有指导意义,研究显示当CTG为无反应型和可疑型时,胎儿出现羊水粪染、Apga评分≤7分(出生1 min)、胎儿窘迫的比例明显高于反应型[4]。临床判读过程中,由于图形的多变和胎儿醒睡周期变化,视觉评估CTG的假阳性率达14.2%[5]。其中,反应型图形相对容易识别,而可疑型和无反应型则是准确识别的难点[6]。同时,受限于判读者的主观性与能力差异,CTG判读结果的医师间差异较高(Kappa值=0.41),可重复性差[7]。由于判读者无法准确识别极端异常图形,延误诊治时机的情况也常有发生。为了提高CTG判读的准确率,计算机化CTG被用于辅助诊断,根据指南模拟临床专家诊断思维的专家系统应运而生。计算机化CTG将单纯视觉评估转变为计算机辅助的已知参数评估,相关的Dawes-Redman判读系统在20世纪80年代被提出,基于这一判读标准开发的计算机化CTG判读系统如Omniview-Sisporto等也继应用于临床[8]。通常的专家系统纳入不同数量特征参数用于建立预测系统,对CTG进行分类判读。研究显示,计算机化CTG辅助诊断下的围产期死亡率与视觉评估CTG无显著差异[9]。此外,由于计算机化CTG系统存在指标不足、算法简单等问题,其诊断准确率不高,只能作为临床诊断的辅助。近年来,随着机器学习技术的迅猛发展,机器学习尤其是深度学习在产前CTG中的应用受到越来越多的关注。
2机器学习相关概念
机器学习是人工智能的重要分支,包括传统机器学习和深度学习(deep learning,DL),后者可以自主从原始数据中提取出非常复杂的函数特征来建立模型[10]。目前,机器学习广泛应用于医学领域,在辅助模拟临床决策方面取得一定成绩。通常情况下,机器学习由数据预处理、特征工程、构建模型3个步骤组成。数据预处理可以解决由孕妇
目前大部分相关研究选用美国加州大学欧文分校机器学习数据库(University of California Irvine MachineLearning Repository),简称UCI数据库。UCI数据库纳入CTG总样本2126例,其三分类判读结果为3名医师依据FIGO指南达成的共识,样本包括反应型1655例(77.8%)、可疑型295例(13.9%)和无反应型176例(8.3%),平均时长31 min,信号丢失率8%,相关胎心参数已经进行数据预处理和特征提取[8]。在该数据库中可以获得CTG的21个特征,涉及形态学、频域及时域3个方面,不包含原始胎心宫缩图形和数据点。需要注意的是,UCI数据库中无反应型和可疑型的样本量远低于反应型,这种不平衡的数据使得模型倾向于产生弱分类器[14]。此外,数据库不包含孕周信息,而CTG图形会随孕周发生变化,也可能对分类结果产生影响[15]。视觉评估CTG中可疑型和无反应型将面临不同的临床处理,是判读和分类的关键。部分研究在实验中剔除可疑型或者只显示总体准确率,导致模型的真正效能难以评价,故本综述未予纳入。
3机器学习在产前CTG判读中的应用
传统机器学习中,决策树[16]、集成学习[17]等算法都曾被应用于产前CTG判读但效果不佳;相比之下,神经网络、支持向量机则取得了较好的结果。相较于传统机器学习,深度学习在产前CTG领域起步较晚,但已然成为新兴的研究热点。
3.1传统机器学习神经网络(neural network,NN)的研究由来已久,在产前CTG判读中应用颇多。尽管传统神经网络[18-21]对UCI数据三分类的总体准确率超过99.0%,但可疑型和无反应型的分类准确率欠佳,分别为72.6%和83.0%[22]。实际分类得到的胎儿状态并非泾渭分明,而模糊集理论则增加了算法对CTG信号的这种不确定性的适应性,以提升神经网络的性能。Ocak等[23]将模糊集理论与神经网络结合得到自适应模糊神经推理系统(adaptiveneuro-fuzzy inference systems,ANFIS),对UCI数据库中的反应型和无反应型进行二分类,准确率分别为97.2%和96.6%。基于此,2018年Fei等[24]提出基于模糊C均值聚类的自适应模糊神经推理系统(fuzzy C-means clusteringbased adaptive neuro-fuzzy inference system,FCM-ANFIS)对UCI数据进行三分类,反应型、可疑型和无反应型的F1score分别达到了98.2%、89.6%和92.9%,是迄今基于UCI数据库进行分类诊断性能最好的模型之一。支持向量机(support vector machine,SVM)基于统计学理论,通过找到最佳分割平面来对数据进行二分类。CTG分类诊断当中,运用不同的SVM模型进行两次二分类时也可得到三分类结果。研究者利用改良SVM模型对UCI数据库分类准确率分别为反应型96.9%、可疑型70.5%和无反应型76.7%[25]。2015年,有学者先基于K-means算法进行特征选择再应用SVM建模(K-SVM模型),获得了较好的三分类准确率,其反应型、可疑型和无反应分别达到了91.2%、90.5%和85.2%[26]。
传统机器学习的效果高度依赖建模前所提取的特征,这势必掺杂研究者的主观因素,具有一定局限性,可疑型和无反应型的预测效果不满意更常常成为研究的瓶颈。与传统机器学习相比,深度学习能够从样本中获取更多的内在信息,或许能够给产前CTG分类提供更优的解决思路,故而人工智能在产前胎心监护领域的研究热点逐渐从传统机器学习转移至深度学习方向。
3.2深度学习经典的深度学习包括卷积神经网络(convolutional neural networks,CNN)等深层神经网络,具有拟合度高、可自主产生特征的优势,但它同时也需要大量的训练数据。深度森林(deep forest,DF)是一种采用多个随机森林替换卷积神经网络中的层的深度学习算法。不同于传统深度学习的大样本量需求,DF在小样本情况下的学习表现良好。2021年,Chen等[14]采用DF算法对UCI数据库CTG进行分类,其反应型、可疑型和无反应型的准确率分别达到了97.0%、87.1%和90.3%;该模型对16 355例的内部数据集进行二分类研究,包括73.3%正常组(反应型)和26.7%异常组(可疑型和无反应型),结果显示分类召回率分别为96.2%和79.1%。近年亦有学者利用其他模型如卷积神经网络与多模态深度学习架构(multimodal deeplearning architecture,MMDLA)对产前CTG进行分类,均获得了较高准确率[27-29]。深度学习和传统机器学习性能比较的研究较少且结论存在较大的差异[30-31]。应用UCI数据库的传统机器学习研究中,基于FCM-ANFIS和利用K-SVM模型的表现较好,而深度学习虽然起步较晚,但已经展现出了在CTG分类的潜力。基于深度学习算法的CTG判读为产前CTG在高危妊娠早期识别和监测提供了新的思路,未来可以建立更大规模的包括原始数据点的产前CTG数据库,进一步促进产前CTG领域的深度学习发展。
4总结与展望
产前电子胎心监护是妊娠期胎儿监测的主要手段之一,CTG准确识别对改善围产儿预后具有重要意义。基于视觉评估的产前CTG监护并未显著减少胎儿的不良临床结局如1 min Apgar评分<7分、缺氧性脑病、新生儿
参考文献略。
来源:中国实用妇科与产科杂志2024年4月第40卷第4期
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)