作者:邓文祎,谢飞扬,薛华丹,中国医学科学院北京协和医学院协和转化医学中心北京协和医院放射科
随着医学成像技术的不断进步和影像检查数量的增加,偶发胰腺囊性病变(pancreatic cystic lesions, PCL)逐年增加,2018年一项基于人群的流行病学研究表明磁共振胆胰管成像(magnetic resonance cholangiopancreaticography, MRCP)发现的PCL患病率高达49.1%。
人工智能(artificial intelligence, AI)通过计算机系统模拟人类的认识规律和学习过程,从而达到自动学习特定知识和技能的目的。机器学习(machine learning, ML)是AI的一个分支,通过经专家定义和标注的特征来执行任务,常见的ML模型包括支持向量机、随机森林和神经网络等。
神经网络包含更多的参数和更大的运算量,是传统基于统计理论的ML方法过渡到深度学习(deep learning, DL)的重要节点。DL是ML领域新发展的先进技术,是包含多个隐藏层的多层神经网络,不需要经专家定义和标注的特征即可执行任务,避免了特征测量产生的误差和主观偏倚,但具有运算量巨大和过拟合等缺点。
卷积神经网络(convolutional neural networks, CNN)是目前医学影像领域广为使用的DL算法,其结构主要包括卷积层、池化层和全连接层,其中卷积层实现特征提取和参数共享,池化层进一步缩小数据处理量和参数量,全连接层整合提取到的特征并最终输出分类或回归等结果,可在一定程度上解决早期DL运算量巨大和过拟合等问题。
目前残差神经网络、U型网络(U-network, U-Net)、密集连接网络等常见高性能DL模型都是以CNN为基础。影像组学也是AI的一个分支,可以挖掘图像中大量预定义的定量特征,包括形状、强度和纹理等,常与ML相结合建立诊断或鉴别诊断模型,近来开始与DL相结合,从示例图像中自动学习特征。
随着现代医学成像设备的发展与数字化的患者图像管理,AI在医学影像领域的应用取得了突破性的进展,可用于图像采集、重建和分析(包括病灶检出、分割、诊断、鉴别诊断等)。
基于AI的图像采集和重建具有速度快、所获图像质量优等特点,AI有望逐步取代传统图像采集和重建工作。人工阅片给医生带来繁重负担,且对医生经验依赖性高,AI辅助的图像分析不仅能够显著提升医生阅片效率,还能够提取更为客观的定量特征,识别人肉眼难以观察到的像素改变。
现有综述主要关注AI在医学影像和胰腺影像等专业领域的总体应用进展或仅关注PCL的良恶性诊断,而本文从PCL的影像检查流程角度出发,总结AI在图像后处理、病灶检出、分割、鉴别和诊断方面的应用进展、所使用模型和应用效果,以推动AI更好地为PCL患者服务。
1. AI在PCL影像领域的应用
1.1 图像后处理
AI辅助的图像后处理软件已发展成规模并实现了商品化。MRCP能显示胰管走行,常用于评估PCL与胰管的连通关系。然而,胰管在不扩张的情况下非常纤细,为清晰显示病灶与胰管是否相通,临床对MRCP图像质量要求较高。传统并行成像获得的MRCP图像采集时间长,导致检查效率低且患者体验差,压缩感知技术虽然能显著缩短采集时间,但是图像信噪比较低,难以清晰显示PCL与胰管间的关系。
Matsuyama等分析了32例导管内乳头状黏液瘤(intraductal papillary mucinous neoplasms, IPMN)患者的常规并行成像呼吸门控三维MRCP、结合并行成像的压缩感知屏气三维MRCP、Fast 3Dm三维MRCP伴或不伴DL重建的图像采集时间和图像质量,发现DL重建的MRCP图像信噪比、对比度噪声比和主观图像质量评分均显著提高,对IPMN的分型能力也提高。
通过DL重建处理的结合并行成像的压缩感知屏气三维MRCP和Fast 3Dm三维MRCP能够在缩短图像采集时间的同时保障良好的图像质量,有望替代传统并行成像技术。
高分辨率CT可提供PCL结构细节特征,以帮助诊断和鉴别诊断。Noda等比较了胰腺条件下双能CT混合迭代重建图像和DL重建图像的图像质量,发现DL重建图像的诊断可接受度、信噪比、对比度噪声比明显更高,背景噪声明显更小,解剖结构的CT值变异更小,可为后续纹理分析等AI研究提供可靠的输入图像数据。
1.2 病灶检出
PCL存在恶性风险,准确及时的病灶检出对后续患者治疗方案制定至关重要。Si等基于284例病变胰腺和35例正常胰腺CT图像,训练完全端到端的DL模型(包含U-Net模型以分割胰腺,残差神经网络模型以定位胰腺、检出病灶)来检出4种常见胰腺囊、实性病变,在测试集上模型正确检出的病灶数占全部样本的比例达82.7%,且模型正确检出了全部IPMN病灶,但值得注意的是可能由于训练集中正常样本较少,对于正常胰腺该模型检出假阳性较高。
Park等基于503例病变胰腺和349例正常胰腺CT图像,建立改良三维nnU-Net模型检出7种常见胰腺囊、实性病变,当模型输出的病灶轮廓与医生勾画的病灶轮廓有重叠,即骰子相似系数(dice similarity coefficient, DSC)大于零时,定义为真阳性结果,模型正确检出的病灶数占全部病灶数的比例在内部测试集为86.2%,在外部测试集为82.9%。
对于直径大于或等于1cm的PCL,模型的检出灵敏度与影像科医生相当(P>0.05),模型的检出灵敏度在内部测试集为92.9%,在外部测试集为91.9%,影像科医生的平均检出灵敏度在内部测试集为95.5%,在外部测试集为95.9%。
相比Si等的研究,Park等提出的模型结果可解释性更高,覆盖病种更全面,训练集队列正常胰腺比例更大,更符合临床实际,但是在训练过程中需要医生手动勾画病灶轮廓,且对于<1 cm的小PCL,模型正确检出的病灶比例显著下降,有研究显示超过50%的PCL患者存在小囊,且小囊患者比例逐年增长,因此对小囊的检出是必要且有待提高的。图像输入前进行放大处理、建立关注图像局部特征的模型可能有助于对小目标的检出。
1.3 胰腺及病灶分割
组学研究和一些DL算法的实施都依赖于病灶的准确分割,然而PCL形态、大小变异大,内部成分复杂,且可位于胰腺的任何位置,因此PCL的准确分割尤其困难。与前述病灶检出仅要求模型分割结果同医生勾画的标准图像相比,轮廓有重叠即为检出成功不同,病灶分割要求模型分割结果与医生勾画的标准图像轮廓尽量贴合。
胰腺是定位PCL的良好参照靶点,Xie等提出了分层分割的思路,首先分割胰腺,再分割PCL,以避免胰腺外组织或病灶被误分割为PCL。然而,胰腺的准确分割同样困难:(1)胰腺形态、大小、位置多变,胰周脂肪组织的减少、缺失、密度增高等变异可造成胰腺与周围组织分界不清;(2)胰腺体积小,仅占二维
Xie等利用分层递归显著转换网络在CT图像上首先进行胰腺分割,该网络在每一次分割中将分割概率图转换为空间权重,并迭代入下一次分割,获得了更准确的分割结果,DSC达83.81%。门脉期图像有助于识别胰腺周围结构,因此大多数研究都关注基于门脉期图像的胰腺分割,但是动脉期图像也值得关注,动脉期图像有助于区分低或无强化的病灶和高强化的胰腺实质,动脉期、门脉期图像在PCL的临床诊断中缺一不可。
Qu等基于渐进融合网络建立配准融合动脉期、门脉期多期相CT图像信息的胰腺分割模型,同时关注全局图像和局部细节多尺度特征,在冠状面、矢状面、横断面进行胰腺的多视角分割,DSC进一步提高到91.19%。
Asaturyan等首先对胰腺区域执行最大流动的分割和最小切割(粗分割),再结合几何描述精细边缘的精细分割算法在MRI上进行胰腺分割(细分割),DSC在1.5T MRI上达79.6%,在3.0T MRI上达81.6%。
Xie等在通过分层递归显著转换网络完成胰腺分割后,继续进行PCL的分割,DSC为68.98%。美国胃肠病学会指南推荐在PCL的管理中使用超声内镜作为CT和MRI的补充,超声内镜有助于发现囊内分隔、壁结节和实性成分,引导细针抽吸活检。
Oh等提出注意力U-Net算法在超声内镜图像上进行PCL分割,在内部测试集上DSC达79.4%,但在外部测试集上仅为69.1%。超声图像受分辨率、探测频率和探测深度的影响较大,且高度依赖操作者和成像设备,使超声图像间的差异较大,基于超声内镜图像建立的PCL分割模型稳定性较差,需要进一步研究更具普适性的分割算法。
1.4 良恶性诊断
PCL的生物学行为从良性到恶性不等,良性、恶性病变的影像特征重叠,基于病灶宏观影像特征的常规影像手段诊断良恶性受到限制。临床处理PCL的一个关键点在于准确识别少数高级别异型增生、浸润性癌和恶性的病灶,如IPMN是具有恶性潜能的PCL,针对IPMN开发了大量AI辅助良恶性诊断模型,帮助恶性患者及早干预以提升预后,避免良性患者过度治疗,在训练集上模型的接收者操作特征曲线下面积(area under the curve, AUC)为0.783~0.980,显示出AI辅助IPMN良恶性诊断的广阔应用前景。
诊断AUC的差异可能源于成像模式不同、训练样本量不同和模型结构不同,而且由于样本量的限制,许多研究没有独立的测试集,难以评估模型的稳定性和普适性。Schulz等利用数据增强技术扩充训练集图像,通过迁移学习技术在公开数据集ImageNet上预训练模型,在仅43例IPMN的小样本上,基于患者超声内镜图像建立DL模型,在独立测试集上模型正确诊断的病灶数占全部病灶数的比例高达99.6%。
另一种解决小样本建模困难的方法是联邦学习,多中心建模能显著增加样本量,但传统的多中心建模需要各中心数据集中输入模型,数据安全和患者隐私等问题限制其实施,而联邦学习的建模过程发生在各参与中心,通过在中心间传递并迭代模型参数来实现多中心建模,有效避免患者数据在中心间的流动,即能满足建模样本量需求,又能保护数据安全,从而被引入临床研究领域,目前联邦学习在新型冠状病毒感染、
PCL的疾病谱广泛,包括IPMN、黏液性囊腺瘤、浆液性囊腺瘤等多种类型,不同类型的PCL临床和影像特征有重叠,难以进行准确的术前分类,将术前良恶性诊断模型限制在特定PCL类型的研究是不全面的。
Springer等基于患者的临床特征、影像特征、囊液成分和基因组学信息建立综合模型,将PCL分为恶性的手术组、交界性的随访组和良性的无需处理组,在测试集上模型正确分类的病灶数占全部病灶数的比例为69%。Wang等基于动脉、静脉双期CT图像建立三维密集连接网络模型诊断PCL良恶性,在内部测试集上AUC为0.933,在外部测试集上AUC为0.911。
大多数研究直接进行PCL的良恶性分类,而较少关注分隔、钙化、壁结节和实性成分等结节的内部特征。影像科医生很大程度上通过结节内部特征判断良恶性,而通过AI方法对结节的内部特征进行分析,增强了模型可解释性功能,可推动AI从科研转向临床应用。有研究利用DL方法分析乳腺
1.5 鉴别诊断
不同PCL的临床处理方案不同,如浆液性囊腺瘤患者仅在有症状时推荐手术,囊变神经内分泌肿瘤大于2 cm时就推荐手术,而2012年仙台指南推荐切除所有能够手术的黏液性囊腺瘤,因此,PCL的鉴别诊断能够帮助临床实现疾病的个性化处理,同样具有重要临床意义。
基于AI方法鉴别有恶性潜能的黏液性肿瘤和没有恶性潜能的浆液性肿瘤的模型很多,在训练集上AUC为0.730~0.994。Dmitriev等利用随机森林提取患者临床特征和宏观CT影像特征,通过CNN提取CT纹理参数,采用其贝叶斯组合建立模型,区分常见的4种PCL:IPMN、粘液性囊腺瘤、浆液性囊腺瘤和囊变实性假乳头状瘤,在交叉验证集上模型正确分类的病灶数占全部病灶数的比例高达83.6%,在测试集上高达91.7%。
现有AI模型的“黑箱”性质导致临床医生在一定程度上对AI辅助临床工作不信任,限制了AI在临床中的推广应用。Dmitriev等使用条件概率空间分析可视化随机森林分类4种PCL的过程,也使用注意力图可视化CNN分类4种PCL的过程,并将CNN可视化的注意力图与通过视觉追踪技术得到的医生的注意力图相比较,得到一个可解释的AI模型。
Li等利用密集连接卷积网络建立不需预先分割病灶的无监督模型,区分4种常见PCL,进一步简化工作流程,在交叉验证集上模型正确分类的病灶数占全部病灶数的比例为72.8%。Chu等进一步将鉴别诊断病种拓宽至更少见的囊变神经内分泌肿瘤,利用基于CT组学特征的随机森林模型区分5种PCL,在交叉验证集上模型正确分类的病灶数占全部病灶数的比例高达94.4%。
2. 总结及展望
AI在PCL影像检查工作流程中的应用研究取得了突破性进展,基于AI的图像后处理技术能够优化医学影像图像质量,清晰显示病灶细节特征,AI辅助的病灶检出灵敏度与影像科医生相当,AI辅助的胰腺及病灶分割为组学研究和DL算法的实施提供了输入准确的感兴趣区,AI辅助的PCL良恶性诊断不仅可帮助恶性患者及早干预,还可避免良性患者过度治疗,AI辅助的PCL鉴别诊断可精准区分不同类型的PCL,从而帮助临床实现疾病的个性化管理。
随着医学图像质量的提升和计算机技术的进步,基于MRI或超声内镜的AI模型研究逐渐兴起,数据增强和迁移学习等新技术的应用弥补了样本量的限制,联邦学习等新技术的发展打破多中心间的数据壁垒,AI模型可视化技术的实施增强了模型可解释性。AI在PCL影像领域的应用正朝着成像模式更丰富、纳入样本更充足、可解释性更完善的方向发展。
来源:邓文祎,谢飞扬,薛华丹.人工智能在胰腺囊性病变影像领域应用进展[J].中国医学科学院学报,2024,46(02):275-280.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)