作者:王远军,上海理工大学健康科学与工程学院;张振强,王振猛,海军军医大学第三附属医院麻醉科
从放射学和病理学的主要诊断到心脏病学和外科学的治疗与介入应用,人工智能已经应用于医学的各个方面。2018年4月,美国食品药品监督管理局批准了第一个使用人工智能的软件,该软件通过分析眼底图像帮助诊断
随着人工智能在医学领域的发展和应用,各个领域的临床医生都需要了解人工智能相关技术的定义及如何利用这些技术来提供更安全、更高效的诊疗。在人工智能领域,深度学习算法是一个热门的研究对象。深度学习算法利用神经网络模型对数据进行建模和训练,可以从大量的医学数据中提取有效特征,应用于医学图像分析、医学信号处理、疾病诊断等多个方面。本文就深度学习在麻醉临床中的应用进行综述。
1. 深度学习概述
深度学习是机器学习的一个子集,其灵感来自人脑中的信息处理模式。深度学习不需要根据任何人为设计的规则进行操作;相反,它使用大量数据将给定输入数据集映射到特定标签。深度学习使用许多层的算法进行设计,每层都提供了对输入数据的不同解释。
使用经典机器技术实现分类任务需要几个连续的步骤,特别是预处理、特征提取、精确的特征选择、学习和分类,其中特征提取对经典机器学习的性能有很大影响,有偏差的特征提取可能导致类之间的错误区分。深度学习与传统的经典机器学习方法不同,深度学习能够自动学习多个任务的特征集,可以一次性完成学习和分类。
深度学习的基础是人工神经网络(Artificial Neural Network,ANN),它是由多个神经元按照一定水平组成的结构,也称感知器。随着人们对模型需求的变化、数据规模的扩大和计算能力的提高,神经网络逐渐从浅层模型演化为深层模型,并在结构上成为多层感知器,也称深度神经网络(Deep Neural Network,DNN)。
深度学习是通过构建深层神经网络模型,并通过激活函数、损失函数和优化算法等方式对模型中的参数进行训练,将输入数据映射到输出结果的一种方法。其中,激活函数是在中间层和输出层使用的一种非线性转换函数,主要作用是将神经元的输入信号进行转换,最终将转换结果传递给下一层神经元;损失函数是深度学习中的一个重要概念,用于衡量模型预测结果与真实结果之间的差距,合适的损失函数可以提高模型的精度;优化算法则根据损失函数不断调整模型参数,从而缩小模型的预测结果与真实结果之间的差距。
2. 深度学习在放射学科与麻醉学交叉领域的应用
在放射学科与麻醉学交叉领域,深度学习被广泛应用于多个方面。本文将重点介绍3个关键的应用领域:使用图像分割方法检测中心静脉导管位置与尖端定位、深度学习辅助神经阻滞和深度学习辅助血管穿刺,并对不同领域使用的方法模型进行归纳总结。
2.1 使用图像分割方法检测中心静脉导管与尖端位置
在X光片上对中心静脉导管与尖端位置的准确性进行评估是放射科医生的一项常见且重要的任务。患者身体结构的变化、医生缺乏导管置入经验及护理人员操作失误均可能导致导管错位,使其尖端偏离正确位置,导致许多致命后果。数据表明,导管尖端放置不当会增加患者出现并发症的可能性,严重时甚至会导致死亡。因此,对中心静脉导管与尖端位置准确性的检测可以说是中心静脉导管使用期间重要的检查项目之一。
Henderson等构建了一个多标签卷积神经网络(Convolutional Neural Network,CNN),可以对新生儿体内导管的类型进行预测。根据测试数据,其算法的总体平均正确率(95%置信区间)对鼻胃管为0.977,对气管插管为0.989,对脐动脉导管为0.979,对脐静脉导管为0.937,其神经网络仅限于检测1~4种导管的类型并给出预测,关于尖端位置的正确性尚未给出说明,仅可用于辅助医生进行相关判断。
Lee等于2017年基于全卷积神经网络(Fully Convolutional Networks,FCN)提出了包含两个用于检测经外周静脉置入中心静脉导管(Peripherally Inserted Central Catheter,PICC)及其尖端位置的系统,并增加了预处理和后处理模块以提高系统的准确性,该系统平均预测PICC尖端位置距离真实值3.1mm,均方根误差为3.71mm。但是,该系统容易将PICC与骨骼边缘混淆,特别是肋骨周围,或可将肋骨标签传入CNN中,让其学习肋骨及其边缘特征,从而将PICC与骨骼边缘区分开来。
Unet是Ronneberger等于2015年提出的一种基于FCN的改进版本,首先利用编码器对低维特征和高维特征进行提取,然后利用解码器初步明确像素特征、位置信息和所属类别的关系,获得最终的预测结果。Unet在训练数据较少的情况下也能保持相当好的性能,在医学图像分割领域广受追捧。
Yu等于2020年基于Unet网络和循环神经网络(Recurrent Neural Network,RNN)提出了一种多任务的深度学习模型,可用来对PICC进行分割与尖端检测。为了定位尖端,其采取了将尖端视为小物体检测任务的做法,使用包含尖端的框状标签,使用RNN提取尖端特征,并采用共享采样层的方式将其构建成组合模型。经过Unet网络的下采样,将获得的64像素×64像素的多通道特征图进行3步操作。
第一步是进行上采样,用于导管的分割任务。第二步是提出可能包含目标的区域,由两个分支组成:一个回归层和一个分类层,回归层用于预测区域的边界,分类层用于确认区域的类别。第三步是将多通道特征图与上述区域合并成感兴趣区域,并添加全连接层以确定类别,由此完成尖端定位任务。该研究一共使用了348张胸片,在导管分割任务中,使用300张胸片用于模型的训练,使用48张胸片用于测试;在尖端检测任务中,使用154张胸片用于训练,使用20张胸片用于测试。其模型获得了比之前流行的几种模型更好的结果。但是由于其尖端检测任务中用于训练的胸片数量较少,因此尖端定位的成功率和准确率都无法满足临床需求。如何使用更好的方法解决这些问题成为未来的工作方向。
2.2 深度学习辅助神经阻滞
在手术过程中,麻醉医生会根据手术的需要选择不同的麻醉方式。臂丛神经阻滞是一种广泛应用于上肢手术的局部麻醉方法。麻醉医生使用超声设备辅助定位臂丛神经,然后对神经进行局部麻醉。但精确的神经阻滞高度依赖麻醉医生的经验,经验不足的麻醉医生在进行神经阻滞时可能会导致神经损伤,因此在超声图像中准确定位臂丛神经显得尤为重要。
González等使用图形切割方法对超声图像进行预分割,以获得感兴趣区域。然后使用非线性小波变换从超声图像中提取特征,并使用高斯过程分类器对像素进行分类,以获得臂丛神经区域。Vashishtha和Aju将Canny边缘检测算法与支持向量机相结合,作为图像预处理的方法,并加入机器学习以实现超声图像的神经分割。然而,上述两种方法使用的是机器学习技术,对数据预处理的要求比较高,对低分辨率和强噪声的超声图像的分割效果并不好。
Tian使用了一个包含340个臂丛超声图像的新数据集,由3位经验丰富的临床医生进行标签整理,并使用了包括FCN、Unet和LinkNet在内的12个神经网络模型进行对比测试。测试中发现Unet实现了最佳的分割精度,但是Unet的参数量远大于排名第二的LinkNet,在相同的算力下,Unet每秒仅能处理15张图像,LinkNet每秒则可以处理142张图像,实现了分割精度与处理效率的平衡,可以减少模型部署对硬件存储的需求。
对损失函数的选择也是该文献的重点内容,经过对交叉熵损失、Dice损失、Focal损失、组合损失、带有Focal损失的交叉熵损失、带有Lovasz-Softmax损失的交叉熵损失进行多次对比测试,该文献选择了带有Lovasz-Softmax损失的交叉熵损失来解决前景和背景类别不平衡的问题。
Wang等在实验中发现,如果单用Unet进行神经分割,Unet有可能无法识别臂丛神经从而导致分割任务失败。其在图像分割任务中通过对不同的组件(如增大输入图像的尺寸,使用RNN模块、数据增强、辅助损失、残差模块等)进行排列组合,判断各组合对Dice值(一种集合相似度度量指标,通常用于计算两个样本的相似度)的影响,其中数据增强对Dice值的影响最大;用于解决自然语言处理和序列问题的RNN提高了获取原始Unet上下文信息的能力;辅助损失提高了判断臂丛神经是否存在的能力,以提高模型的准确性。
该研究使用了2016年Kaggle竞赛中发布的5 635张超声臂丛神经数据集图片,将数据集分成5 071张带标签的臂丛神经图片和564张测试图片,最终其提出的模型的有效性比原方法提高了6%。
何东杰在2022年以二阶段目标检测器mask RCNN为雏形,搭建了高精度目标检测网络IDNet,在IDNet中提出了两个新的模块,一个是可以实现含有纹理信息的高分辨率特征图和含有语义信息的低分辨率特征图融合、减少关键信息丢失等目标的全连接特征金字塔网络(FCFPN);另一个是提升模型在边缘特征提取性能的均值迭代区域生成网络(MIRPN)。通过在臂丛超声图像数据集上与主流网络进行对比实验,发现其提出的网络在臂丛神经上获得了32.57的精确度,是对比实验中的最佳成绩。
因此,深度学习技术的不断发展,使医学图像处理的准确性得到提升,有助于麻醉医生判断臂丛神经的位置,减少反复穿刺可能引起的并发症。
2.3 深度学习辅助血管穿刺
因为颈内静脉具有较快的血流速度和较宽的管径,所以临床工作中广泛使用颈内静脉进行深静脉穿刺,特别是在为患者提供营养支持、治疗疾病及监测病情等方面。颈内静脉也可以用于紧急情况下为患者提供药物治疗。然而,这种穿刺方法也有一定的风险,因此术前对血管位置的检测显得尤为重要。
Ding提出的主动轮廓模型(Active Contour Model,ACM)是过去几年比较流行的血管分割方法之一。ACM在处理具有挑战性的血管分割问题上显示出了高效的性能,非常适用于确定医学图像中强度不均匀的血管和周围组织的边界,因此许多类型的ACM被提出来用于血管分割。
Dong等通过将管状几何信息输入三维超声模型解决3D血管分割问题。张量主动轮廓模型(Tensor-based Active Contour Model,TACM)利用了局部-全局ACM和基于张量的血管增强滤波的优点,其有效性已在临床3D超声和多光子显微镜数据集上得到验证。临床实验证明,TACM能比以前的模型获得更平滑、更准确的血管边界。
近期,神经网络在血管分割领域取得了卓越的效果。Lian基于Unet提出了一种新的网络模型,用于分割血管周围间隙(Perivascular Spaces,PVS)。该方法首先采用非局部Haar变换的方法对核磁共振图像进行滤波,以增强管状结构。然后将原始图像和增强图像作为初始输入,以提供更加详细的结构信息。最后将生成的PVS概率图作为额外的通道加载到网络中,以进一步辅助上下文信息,增强分割结果。
Kitrungrotsakul等受到现有传统血管提取方法和深度学习框架的启发,提出了一种名为VesselNet的多路径肝脏血管分割架构,其使用DenseNet作为主干网络,并结合多个网络以降低过拟合的概率。VesselNet使用血管概率图图像作为神经网络的输入,而不是原始CT图像。与现有的基于深度学习的血管分割方法相比,该方法更稳健,对CT强度的变化更不敏感。
Huang等提出了一种基于FCN的CT图像肝血管提取方法,在训练样本少、标注不完全的情况下,采用数据增强进行训练。Huang等还提出了一种基于Dice的新相似度指标,并用于损失函数,以提高在前景和背景类体素不平衡情况下的分割准确性和敏感性。
Keshwani等提出了一种用于重建血管树任务的3D FCN,使用新的连通性度量,考虑类间距离和类内拓扑距离之间的中心体素对,利用最短路径树算法,并利用学习到的连通性度量,从血管源开始重建血管树,同时完成在血管中心线上检测体素和评估待重建树结构中心体素之间的连通性的任务,并减少因语义分割导致的有噪声的错误分类。
利用深度学习技术提取血管的位置信息,可以提高临床医生进行血管穿刺的准确率和成功率,为患者带来更好的治疗效果。
3. 小结
本文通过探讨深度学习在放射科与麻醉学交叉领域的应用,展示了该领域的潜力和未来发展方向。放射科与麻醉学的结合为麻醉手术提供了更精确、更安全和更高效的方法,深度学习技术的快速发展则为此带来了许多创新。本文涵盖了最近的研究成果,并将与深度学习相关的应用进行了分类和总结。
在放射科方面,目前深度学习已经应用于放射影像自动分析、图像识别和目标定位等领域。这些应用提高了放射影像诊断的准确性和效率,为放射科医生提供了更好的辅助工具。在麻醉学方面,深度学习可以提供安全性预测和剂量优化。这些应用有助于提高麻醉手术的效果和患者的安全性。
深度学习能够快速、准确地筛选大量存储的数据,并揭示人类认知无法察觉的相关性和模式。神经网络模型训练需要使用一定规模的数据集,在麻醉学领域,通过临床获取数据集通常需要很长时间。
此外,使用不同数据集训练获得的模型效果也有所差距,如何获得一个高质量的数据集是一个难点。现阶段的神经网络算法主要用于辅助麻醉医生的操作,以减少麻醉医生的工作量,同时提高麻醉操作的准确性和便捷性。未来,随着深度学习算法的迭代和优化,相信其在临床麻醉领域的应用会进一步拓展,深入麻醉工作的各个方面。
来源:张振强,王远军,王振猛.深度学习在放射学科和麻醉学交叉领域的应用进展[J].生物医学工程学进展,2024,45(01):42-47.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)