Modelización predictiva en situación de alarma sanitaria

Loading...
Thumbnail Image

Official URL

Full text at PDC

Publication date

2025

Advisors (or tutors)

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations
Google Scholar

Citation

Abstract

Con el fin de poder realizar una asignación eficiente de los recursos sanitarios disponibles, y a partir de datos publicados por el Ayuntamiento de Madrid, se ha construido un modelo predictivo capaz de permitir descartar con confianza a los individuos con menor vulnerabilidad en un contexto de emergencia sanitaria similar a la pandemia de COVID-19. A nivel metodológico, los resultados obtenidos en el uso de técnicas como la regresión logística binaria o el bagging han permitido alcanzar un modelo parsimonioso basado en la edad, otras patologías previas y el nivel de exposición a determinados contaminantes atmosféricos, con una especificidad superior al 89%, un AUC aceptable y sin signos de sobreajuste. La variable edad presentó un efecto protector contraintuitivo, por lo que se amplió el estudio con ANOVA y diferentes pruebas no paramétricas como el coeficiente de correlación de Spearman, el test U de Mann-Whitney o el de la Chi-cuadrado. Esta exploración complementaria confirmó la existencia de una relación no lineal que podría ser consecuencia de sesgos muestrales. Por supuesto, el estudio no pretende ofrecer un diagnóstico clínico sino proponer una herramienta complementaria que permita mejorar la toma de decisiones en políticas de salud pública en situaciones de escasez de recursos sanitarios. El trabajo muestra la integración entre técnicas clásicas y modernas de la estadística aplicada lo que, además de proponer un modelo con utilidad práctica, ilustra la evolución de la estadística en la era del aprendizaje automático.
Abstract: With the purpose of being able to accomplish an efficient assignment of the available health resources, and parting from the data published by the Ayuntamiento de Madrid, a predictive model has been designed to be able to confidently discard the individuals with a lesser vulnerability in a sanitary emergency context similar to the COVID-19 pandemic. On a methodological level, the gathered results in the use of techniques such as the logistic binary regression or bagging, have allowed the accomplishment of a frugal model based on the age, other previous pathologies and the level of exposure to certain atmospheric pollutes, with a specificity over 89%, an acceptable AUC and with no signs of over adjustment. The variable age presented a protective anti-intuitive effect, thus the study was amplified with ANOVA and different non parametric tests such as the Spearman correlation coefficient, Mann-Whitney’s U test or Chi-square. This complementary exploration confirmed the existence of a non linear relation that could be a consequence of sampling biases. Of course, the study does not pretend to offer a clinical diagnosis but suggests a complementary tool that can improve the political decision making in public health care in the light of limited health resources. The study shows the integration of classic and modern techniques of applied statistics which, in addition to suggesting a model with a practical utility, illustrates the evolution of statistics in the automatic learning era.

Research Projects

Organizational Units

Journal Issue

Description

Keywords