庄晓东专访:打破传统,应用机器学习算法预测长期心血管疾病的发生|ACC 2019
发布时间:2019-03-21   |   来源:医脉通
关键词: 庄晓东 ACC 心血管疾病 机器学习

医脉通采访报道,未经授权请勿转载。


当地时间3月16日,第68届美国心脏病学会科学年会(ACC 2019)在新奥尔良Ernest N. Morial会议中心开幕。本次会议上,新技术与临床医学的交叉碰撞引起了广泛关注。医脉通就机器学习应用等问题对中山大学附属第一医院心内科庄晓东医生做了专访。



医脉通:请您简单介绍下机器学习和心衰预测这项研究的内容和结果。


庄晓东医生:近两年机器学习很火,我们比较关心机器学习对于心血管病的预测价值。


过去用于预测心血管疾病风险的模型很多,比如Framingham危险评分,但在心衰领域运用的较少;其他一些评分,比如评估房颤的CHADS2评分、评估冠心病的GRACE评分则运用较多。虽然这些模型容易被理解,但准确性不高、误差较大。


而机器学习可以做到准确性高、误差小,但往往用的都是黑箱模型,即“看不见”的模型,令人难以理解。


我们考虑将机器学习和传统模型结合起来,让模型更准确、误差小、区分度高,同时更容易被理解。研究中比较关键的一步,是将重要的影响因素挑选出来,并运用深度表型学分析,在几百个变量中找出前十几、二十个关键变量,用这些变量进行建模。


在我们的研究中,大约有15000人的队列样本量,进行了20多年的随访,运用深度表型学的方法,把关键的前二十个重要因素找了出来,比如年龄、肾功能、心电图表现等等,再通过它们进行分析,大概得出一个结果。


在旧的模型中,如果横纵坐标轴分别代表准确度与区分度,目前的模型两方面都是比较低的;最远端的模型是最理想但是不存在的(准确无误差),属于黑箱模型。如果将模型变量减到看得到的变量时,模型的解释性就相对较强。


将我们的模型与传统模型进行比较后发现,无论是使用变量的数量、可解释性、准确性,还是区分度,都优于传统模型。在我看来,机器学习并不是替代了传统的方法,而是对其进行了优化,它让以前“看不见”的模型,能够被看见,并且结果更加准确,可应用于临床。


医脉通:这项研究的临床意义是什么?


庄晓东医生:从前,机器学习在心血管方面的使用并不多。机器学习作为一个交叉学科,虽然成为了人们心中的研究热点,但是它应用性和实用性相对较差。


我们的研究提供了一种可能性,它像一个桥梁,将老问题与新学科进行串联。它最大的意义在于,让临床医生看得懂,并了解哪些模型是相对重要的,而且该研究模型的准确性是可以被验证的!


医脉通:在本次ACC年会上,您有什么样的收获呢?您比较关注哪些内容呢?


庄晓东医生:本次ACC大会的热点很多,其中最热的内容应该就是《2019 ACC/AHA心血管疾病一级预防指南指南》的发布了,这部指南综合了过去的五部指南,并在推荐上有一些新的建议,比如阿司匹林的推荐等级,以及一些新药、老药的推荐等级变化。


其他研究热点,比如在抗血小板药物治疗方面,延长双抗时间还是单抗,包括双通道的抗血小板,这些都是我个人比较感兴趣的内容。此外,瓣膜病的介入治疗,在今年也有了突破性的进展。


研究摘要


机器学习的深度表型和长期心力衰竭的预测


在基于人群的研究中,机器学习可能有助于表征心血管风险,预测结局,识别生物标志物。为了测试随机生存森林的能力,我们采用机器学习技术,比较了其与标准心血管风险评分预测心衰的能力。


该研究纳入了来自ARIC(社区动脉粥样硬化风险)研究的参与者。ARIC旨在研究亚临床疾病进展为心血管事件,参与者最初没有心血管疾病。基线评估用于预测35年随访期间的心力衰竭结局。两名医生审查了所有的医疗记录,进行独立的终点分类和事件日期分类。作为终点的心衰事件包括医生诊断的症状性心衰和接受心衰药物治疗的患者。共获得来自影像学和非侵入性检查、问卷和生物标记物的625个变量。随机生存森林技术被用于确定心力衰竭的最佳预测因子。我们评估了每个预测模型的性能,使用Harrell一致性指数(C-index,CI)区分测试数据集上的心衰,使用Brier分数(BS)评估预测的准确性。较高的CI和较低的BS表示更好的预测性能。


来自ARIC研究第一次随访的13,852名参与者均被纳入,平均年龄为54.2±5.8岁,45.3%为男性。Top 10列表与传统的心血管危险因素相反。年龄、血糖体重指数是心力衰竭的最重要的预测指标。


预测长期心衰的CI值为0.76 (95%CI 0.68-0.81)。随机生存森林技术的表现由于传统的风险评分,预测准确度提高,BS降低了10%-25%。


继续深度表型分析的机器学习技术提高了最初无症状人群中心血管事件预测的准确性。


Deep Phenotyping and Prediction of Long-Term Heart Failure by Machine Learning (1057-05)


Authors: Xiaodong Zhuang, Xiuting Sun, Xiangbin Zhong, Huimin Zhou, Shaozhao Zhang, Xinxue Liao, Cardiology Department, First Affiliated Hospital of Sun Yat-Sen University, Guangzhou, People's Republic of China


Background: Machine learning may be useful to characterize cardiovascular risk, predict outcomes, and identify biomarkers in population studies. To test the ability of random survival forests, a machine learning technique, to predict heart failure (HF) in comparison to standard cardiovascular risk scores.


Methods: We included participants from the ARIC (Atherosclerosis Risk in Communities) Study. ARIC was designed to study progression of subclinical disease to cardiovascular events where participants were initially free of cardiovascular disease. Baseline measurements were used to predict heart failure outcomes over 35 years of follow-up. Two physicians reviewed all medical records for independent end point classification and assignment of event dates. Criteria for incident HF as an end point included symptomatic HF diagnosed by a physician and patient receiving medical treatment for HF. Six-hundred twenty-five variables from imaging and noninvasive tests, questionnaires, and biomarker panels were obtained. Random survival forests technique was used to identify the top predictors of heart failure. We assessed the performance of each prediction model to discriminate HF on the test data set using Harrell concordance index (C-index), and the accuracy of prediction using the Brier score. Higher C-index and lower BS indicate better prediction performance.


Results: All 13,852 participants from ARIC visit 1 were included. The average age was 54.2±5.8 years, and 45.3% were male for 13,852 participants in ARIC. The top-10 lists as opposed to traditional cardiovascular risk factors. Age, glucose, and body mass index were the most important predictors for heart failure. The C-index for the long-term HF prediction was 0.76 (95%CI 0.68-0.81). The random survival forests technique performed better than established risk scores with increased prediction accuracy (decreased Brier score by 10%-25%).


Conclusion: Machine learning in conjunction with deep phenotyping improves prediction accuracy in cardiovascular event prediction in an initially asymptomatic population.


专题链接>>> 第68届美国心脏病学会科学年会(ACC 2019)

(本网站所有内容,凡注明来源为"医脉通",版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明"来源:医脉通"。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)
1
收藏
添加表情
全部评论
我要投稿
发表评论
扫码分享

微信扫码分享

回到顶部