Estudio de predicción del riesgo de mortalidad en personas con VIH utilizando métodos de Machine Learning
Loading...
Official URL
Full text at PDC
Publication date
2025
Authors
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citation
Abstract
Antecedentes: A pesar de los avances en el tratamiento antirretroviral (TAR), las personas con VIH tienen un mayor riesgo de muerte que la población general. Actualmente, existen pocos modelos predictivos de mortalidad basados en datos europeos.
Objetivo: Desarrollar modelos de machine learning para predecir el riesgo de mortalidad por todas las causas a 5 años en personas con VIH de la cohorte CoRIS.
Materiales y Métodos: CoRIS es una cohorte multicéntrica española de adultos VIH positivos naïve al TAR. Se utilizaron como predictores datos sociodemográficos, inmunológicos y clínicos. Los valores ausentes se imputaron mediante el algoritmo missForest. Se entrenaron tres modelos de machine learning con el 80% de los datos: regresión de Cox con (1) Least Absolute Shrinkage and Selection Operator (LASSO) y (2) Elastic Net (ENET), y (3) Random Survival Forest (RSF). El 20% restante se usó para validación. El rendimiento se evaluó
con el C-index y se comparó con un modelo de Cox que utilizaba el índice VACS 1.0 como predictor.
Resultados: Se incluyeron 15784 participantes, de los cuales 314 fallecieron durante el seguimiento. El modelo basado en VACS alcanzó un C-index de 0.79 (IC 95%: 0.73, 0.84). Los modelos de machine learning obtuvieron mejores resultados: LASSO (0.83; IC 95%: 0.78, 0.88), ENET (0.84; IC 95%: 0.79, 0.88) y RSF (0.85; IC 95%: 0.80, 0.90).
Conclusiones: Los modelos de machine learning, especialmente RSF, mostraron una mejor precisión predictiva, por lo que son herramientas prometedoras para evaluar el riesgo de mortalidad en VIH.
Description
Background: Despite advances in antiretroviral treatment (ART), people living with HIV (PLWH) continue to experience higher mortality than the general population. To date, few predictive models for mortality have been developed using European data.
Objective: To develop machine learning models to predict 5-year all-cause mortality risk in PLWH from the CoRIS cohort.
Methods: CoRIS is a Spanish multicenter cohort of HIV-positive adults naïve to ART. Sociodemographic, immunological and clinical data were used as predictors. Missing values were imputed using the missForest algorithm. Three machine learning models were trained on 80% of the data: Cox regression with (1) Least Absolute Shrinkage and Selection Operator (LASSO) and (2) Elastic Net (ENET), and (3) Random Survival Forest (RSF). The remaining 20% was used for validation. Performance was evaluated using Harrell’s C-index and compared to a Cox model using the VACS 1.0 index as a predictor.
Results: 15784 participants were included, of whom 314 died during follow-up. The VACS-based model achieved a C-index of 0.79 (95% CI: 0.73, 0.84). The machine learning models performed better: LASSO (0.83; 95% CI: 0.78, 0.88), ENET (0.84; 95% CI: 0.79, 0.88) and RSF (0.85; 95% CI: 0.80, 0.90).
Conclusions: Machine learning models, especially RSF, showed better predictive accuracy, making them promising tools for assessing mortality risk in PLWH.