作者:张玉蕾,姚旭峰,吴韬,上海健康医学院医学影像学院
正常衰老过程中,大脑可发生与认知能力相关的生物变化、结构萎缩及功能减退等。神经影像学数据能反映大脑健康状况,可用于评估衰老过程中的潜在风险如认知能力下降等[。脑龄可作为生物标志物反映人脑健康程度,且对于研究神经退行性疾病,如阿尔兹海默病(Alzheimer disease,AD)、轻度
预测年龄差异(predicted age difference,PAD)指预测脑龄与实际年龄之间的差值,与衰老和脑部疾病相关,可反映大脑非正常衰老的变化特征,从而分析发病风险及致病因素等。基于大规模神经影像学数据,如结构MRI(structural MRI,s MRI)、功能MRI(functional MRI,f MRI)及弥散张量成像(diffusion tensor imaging,DTI)等提取特征建立预测脑龄模型有助于更全面地揭示大脑病理学。
传统机器学习(machine learning,ML)算法已广泛用于预测脑龄。近年来,随着深度学习(deep learning,DL)及医学影像学技术的进步和发展,人工智能已能自动提取数据中的特征并用于预测脑龄。本文就基于不同算法、不同模态数据及不同中心数据集的影像学预测脑龄研究进展进行综述。
1.基于不同算法预测脑龄
1.1传统ML
利用传统ML算法可根据神经影像学数据准确预测脑龄;相比以往通过MRI或CT直接观察大脑结构变化、进行认知测试评估等,具有准确率高、自动化和学习快速等优势,可用于开发和优化临床及基础研究算法。目前常用于预测脑龄的ML算法包括支持向量回归(support vector regression,SVR)、相关向量回归(relevance vector regression,RVR)及随机森林(random forest,RF)等。
DAFFLON等纳入10 307名健康受试者,以提取的皮层厚度和体积作为输入数据,采用基于树的优化工具自动化ML库及遗传编程方法预测脑龄,其平均绝对误差(mean absolute error,MAE)为4.61年。SUN等针对403名健康受试者提取灰质体积(gray matter volume,GMV),采用XGBoost模型联合博弈论方法SHAP(shapley additive explanations)预测脑龄,其MAE为7.95年。不同研究所用ML算法类型及其参数、样本量、样本构成和输入特征等均存在较大差异,预测脑龄的准确率亦不同。后续应通过进一步规范化研究全面评估ML算法的预测效能。
1.2 DL
基于大型和多样化MRI数据集预测脑龄时,DL算法优于传统ML算法。LIN等采用DL算法对594名健康老年人提取灰质密度图,并以基于Alex Net的迁移学习为特征提取器进行拼接和降维后输入RVR以预测脑龄,其MAE为4.51年,为改进传统预测脑龄模型带来了新的启示。
COUVY-DUCHESNE等认为以DL模型预测脑龄明显优于支持向量机(support vector machine,SVM),其MAE为3.82~4.18年。LOMBARDI等则采用不同ML算法预测脑龄,发现深度神经网络(deep neural network,DNN)的效能最高,MAE为4.60年。JOO等采用卷积神经网络(convolutional neural network,CNN)与多层感知机组合算法基于健康成年人MR T1WI预测脑龄,其最优MAE为3.494年、均方根误差(root mean square error,RMSE)为4.689年、决定系数(coefficient of determination,R2)为0.933,效能优异。
JIANG等根据1 454名健康受试者大脑结构网络MRI建立三维CNN,发现相比高斯过程回归(Gaussian process regression,GPR)和RVR,其预测脑龄的价值更高,尤以额顶叶网络的效能最优,MAE为5.55年。未来可建立更先进的DL算法模型,以更准确地预测正常人群脑龄;但仍需针对模型的可解释性和设备复杂性等问题进行深入探讨。
2.基于不同模态数据预测脑龄
2.1单模态数据
预测脑龄研究中,输入数据的类型可影响预测结果。由于MR T1WI分辨率较高,可清晰显示人脑解剖结构,目前多利用该类数据预测脑龄。BEHESHTI等以健康成年人MR TIWI为训练集对多种回归算法进行训练,发现各回归算法用于预测测试集脑龄的MAE为4.63~7.14年。
BAECKER等基于全脑区域或体素s MRI数据,采用主成分分析进行降维,建立SVR、RVR和GPR模型以预测脑龄,其MAE为3.7~4.7年;且该研究结果显示,输入数据类型对模型性能的影响大于模型类型。PERSSON等建立CNN模型,基于MRI数据预测脑龄的MAE为4.29年。HWANG等根据MR T2WI数据基于CNN预测脑龄,其在内部测试集的MAE为4.22年。
2.2多模态数据
相比单模态数据,大脑多模态影像学数据用于预测脑龄多具有更高的准确性;如以预测脑龄模型基于多模态数据评估神经退行性疾病的准确率和敏感度均较高。ROKICKI等采用RF基于MR T1WI、T2WI及动脉自旋标记图像数据建立模型,发现相比单模态数据,利用多模态数据预测脑龄的效能更优。NIU等纳入青少年受试者建立多模态及单模态影像学ML模型,10折交叉验证结果显示,多模态GPR模型预测脑龄准确率最高,MAE为1.38年,R2为0.77。
CAI等根据s MRI及DTI数据预测儿童脑龄,结果显示,相比单模态数据模型,多模态数据模型的准确率更高,其MAE为0.15年、RMSE为0.21年。此外,有研究发现采用多模态影像学数据预测脑龄可进一步提高诊断脑疾病和评估预后的准确性。目前对于利用多模态数据模型可否降低预测偏差仍不明确,有待后续进一步观察。
3.基于不同数据集预测脑龄
3.1单一中心数据集
基于单一中心数据集预测脑龄时,无需对不同来源数据进行整合和处理,较为便捷。PENG等基于单一UK Biobank数据库(n=14 503)建立的模型预测脑龄的MAE仅为2.14年。LIU等根据2 501名受试者的MR T1WI数据建立预测脑龄模型,发现相比传统形态学特征,该模型的预测效能更佳,其在测试集的MAE为3.73年。
3.2多中心数据集
相比单一中心数据集,基于多中心数据集预测脑龄的效能更为优异。为提高预测脑龄的准确性,REN等基于多个开源数据集的大量MRI训练DL网络,所获模型用于预测脑龄的MAE为3.96年。WANG等以来自6个公开数据集(n=2 406)的各向异性分数数据对三维CNN进行训练,并采用双环嵌套交叉验证方案和10倍交叉验证程序,结果显示其预测脑龄的MAE为2.79年。
综上,基于多中心数据集训练模型可使其学习多样化特征,有助于更好地预测训练数据来源之外其他人群的脑龄;但目前此类报道较少,有待后续进一步探索。
4.小结及展望
基于影像学可较好地预测脑龄。利用传统ML算法常需人工选择模型和参数并加以优化,处理高维数据的性能有所下降,而用于复杂问题和大规模数据集时则灵活度不足、效率有限。DL算法的可解释性较差,无法深入分析大脑病理生理的潜在机制,多在训练集表现良好而用于其他数据的泛化能力较差。另一方面,尽管基于多模态、多中心数据预测脑龄效能更优,但目前多数研究仅基于易获得的单中心、单模态数据进行。未来应对传统ML及DL算法加以改进;而多模态数据融合仍是预测脑龄研究的发展方向。采用更多样的公开数据集、扩大样本量、构建更全面的预测模型将有助于提高预测脑龄的准确率。
来源:张玉蕾,姚旭峰,吴韬.影像学预测脑龄研究进展[J].中国介入影像与治疗学,2024,21(09):561-564.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)