标题:Development of Severe COVlD-19 Adaptive Risk Predictor (SCARP), a Calculator to Predict Severe Disease or Death in Hospitalized Patients With COVlD-19
发表杂志:Annals of Internal Medicine
IF:19.6
研究方法:回顾型队列研究
发表时间:March 2nd 2021
研究背景
新型冠状病毒肺炎(COVID-19)的临床管理面临重大挑战:部分患者病情初期表现平稳,却在短时间内迅速恶化为重症甚至死亡。现有预测工具(如COVID-GRAM、4C评分)多依赖入院时的静态数据,难以捕捉住院期间动态变化,导致风险误判和资源分配低效。为此,约翰霍普金斯大学研究团队开发了SCARP(Severe COVID-19 Adaptive Risk Predictor),一种整合动态临床数据的风险预测工具,可实时评估患者未来1天及7天内进展为重症或死亡的风险,为临床决策提供精准支持。

研究中使用了约翰·霍普金斯冠状病毒精准医学分析平台(JH-CROWN)数据库,该数据库直接从临床电子健康记录中提取数据,包括患者的人口统计学特征、入院来源、行为风险因素、合并症、体重指数等基线数据,以及生命体征、实验室检查结果和炎症标志物等动态数据。
数据处理和AI建模分析
为了处理时间变化的数据,研究员所有协变量和结果被划分为6小时间隔,以考虑患者健康状态的时间变化性。对于同一时间变化协变量在单一间隔内的多次观察,选择最偏离正常范围的值作为该间隔的代表值。例如,如果一个6小时的时间段内多次记录了同一生命体征,研究人员会选择最偏离正常范围的值来代表该时间段的值。对于实验室检查结果,研究人员使用了过去24小时内最异常的值,而对于某些不每天进行的检查项目,则使用了过去72小时内最异常的值。此外,针对临床常见的数据缺失问题,模型利用随机森林算法的内置插补功能,从非缺失数据中随机抽取填补值,显著提升了鲁棒性。

RF-SLAM预测模型
在预测模型的选择上,研究人员采用了随机森林生存、纵向和多变量分析(RF-SLAM)模型。这是一种基于随机森林算法的机器学习方法,能够处理时间依赖的协变量和右删失生存数据,适用于动态预测患者的风险。模型的输入变量包括105个潜在预测因子,如人口统计学特征、生命体征、实验室检查结果等。对于缺失数据,研究人员在构建决策树的过程中采用自适应填充方法,随机从非缺失数据中抽取值进行填充。模型的性能通过多种方法进行评估,包括交叉验证、医院特定验证和前瞻性验证。交叉验证使用所有医院的数据进行训练和测试,评估模型的整体性能;医院特定验证通过排除一个医院的数据进行训练,使用该医院的数据进行测试,评估模型在不同医院数据上的泛化能力;前瞻性验证则使用早期数据进行训练,后期数据进行测试,评估模型在时间上的稳定性。
此外,研究人员还通过计算每个变量在随机森林模型中被使用的频率来评估变量的重要性,并使用依赖图来直观展示变量与预测风险之间的关系。此方法不仅提高了模型的预测准确性,还增强了模型的可解释性,使临床医生能够更好地理解和应用模型的预测结果。

使用RUC值进行模型性能评估
为了验证模型的有效性,研究团队通过三重验证策略确保模型可靠性:
内部交叉验证:研究人员使用了交叉验证的方法来评估模型的整体性能,将所有医院的数据合并在一起,然后随机划分为训练集和测试集。模型在训练集上进行训练,然后在测试集上进行测试,以评估模型的预测准确性。这种方法可以有效地利用所有数据,同时避免过拟合的问题。
时间验证:为了评估模型在时间上的稳定性,研究人员采用了前瞻性验证的方法,将数据分为两个时间段:2020 年 3 月 5 日至 7 月 4 日的数据用于模型训练,2020 年 7 月 5 日至 12 月 4 日的数据用于模型测试。这种方法可以评估模型在不同时间点上的表现,确保模型在时间上的稳定性和可靠性。
医院特异性验证:为了评估模型在不同医院数据上的泛化能力,研究人员采用了医院特定验证的方法,每次排除一个医院的数据,使用剩余医院的数据进行模型训练,然后在被排除的医院的数据上进行测试。这种方法可以评估模型在不同医院数据上的表现,确保模型在不同医疗环境中的适用性。
研究人员使用了接收者操作特征曲线下面积(AUC)来评估模型的区分度。AUC 值越接近 1,表示模型的区分度越好。具体来说,他们在住院的第一周和第二周分别评估了 1 天和 7 天风险预测的 AUC 值。结果显示,1 天风险预测的 AUC 值在第一周和第二周分别为 0.89(95% CI, 0.88 to 0.90)和 0.89(95% CI, 0.87 to 0.91),7 天风险预测的 AUC 值在第一周和第二周分别为 0.83(95% CI, 0.83 to 0.84)和 0.87(95% CI, 0.86 to 0.89)。

第一行对应的是包含所有医院站点数据的交叉验证 AUC 估计值。接下来的各行对应的是通过剔除一家医院进行交叉验证得出的各医院的特定表现。对于医院站点的交叉 验证,主要医院始终包含在训练数据中。最后一行对应的是前瞻性验证,其中 2020 年 3 月 5 日至 7 月 4 日的数据用于训练,2020 年 7 月 5 日至 12 月 4 日的数 据用于验证。
这些结果表明,SCARP在预测新冠患者病情恶化方面具有较高的准确性。模型的校准曲线也显示,预测风险与实际观察风险之间的一致性良好,进一步验证了模型的可靠性。
总结与展望
综上所述,本研究开发的SCARP工具利用RF-SLAM的预测能力和超过3000名COVID-19住院患者的纵向数据,提供了一个交互式、动态的风险预测工具。SCARP的开发为医护人员提供了一个强大的工具,可以帮助他们更好地管理新冠患者的临床治疗。通过动态预测患者的风险,医护人员可以更及时地调整治疗方案,合理分配医疗资源,并与患者及其家属进行更有效的沟通。此外,SCARP的预测结果还可以为临床试验提供参考,帮助研究人员更准确地评估新疗法的效果。未来的研究将进一步验证SCARP的广泛适用性和性能,为新冠患者的治疗和管理提供更多的帮助。
焕一生物解决方案
焕一生物(AliveX Biotech)在 AI 分析模型的开发与优化方面具备国际领先的技术实力。依托随机森林生存分析、深度学习、神经网络等多种先进 AI 算法,能够精准解析复杂临床数据,涵盖时间动态生命体征、实验室检测指标、疾病严重程度等关键变量,为疾病进展风险预测提供高效解决方案。公司的AI分析团队不仅专注于 AI 模型的开发,还致力于模型的精准优化与最优选择。通过交叉验证、AUC 评估等严格的性能评估方法,确保所选模型在准确性、稳定性和泛化能力方面达到行业领先水平。结合多模型对比分析,能够选择最优算法,以最大化临床决策支持的可靠性。
当前,焕一生物正积极探索 AI 与医疗的深度融合,推动精准医疗发展。期待与临床、科研及产业合作伙伴携手,共同探索 AI 在医学诊断、疾病预测及个性化治疗领域的创新应用。欢迎点击关注焕一生物(AliveX Biotech)微信公众号,获取更多产品详情及技术支持。
【参考文献】
Wongvibulsin, S., Garibaldi, B. T., Antar, A. A. R., Wen, J., Wang, M.-C., Gupta, A., Bollinger, R., Xu, Y., Wang, K., Betz, J. F., Muschelli, J., Bandeen-Roche, K., Zeger, S. L., & Robinson, M. L. (2021). Development of Severe COVID-19 Adaptive Risk Predictor (SCARP), a calculator to predict severe disease or death in hospitalized patients with COVID-19. Annals of Internal Medicine.
https://doi.org/10.7326/M20-6754
关于焕一生物
焕一生物(AliveX Biotech)是中国领先的AI+多组学技术平台公司,拥有端到端干湿实验闭环的多组学实验平台以及AI生物计算平台,包括时空单细胞组学,靶向蛋白组学、代谢/脂质组学等高质量生物检测分析技术以及多组学整合分析、AI建模、知识图谱、疾病药理机制建模等计算技术高效赋能研发。焕一生物拥有国际领先的跨学科院士教授以及产业专家团队,为科研以及药企合作伙伴提供定制化的科研解决方案,包括疾病与药物的机制研究,生物标志物和靶点的发现与评估,患者分层,多模态AI预测,临床试验方案与精准诊疗方案的优化等。焕一生物已服务上百家临床及科研院所和国际大型药企。公司拥有核心技术自主知识产权数十项,并获得国家级高新技术企业认证,美国病理学会CAP认证,ISO9001认证。

收藏
登录后参与评论