Guillén López, Antonio JesúsFernández Menéndez, JoséCamargo Orozco, Wendy Johanna2025-10-062025-10-062025https://hdl.handle.net/20.500.14352/124524Este trabajo tiene como objetivo predecir el corte total del seguro médico en pacientes con traumatismo del estado de Nueva York y analizar la contribución de variables clínicas, administrativas y demográficas en este coste. Se emplea la base de datos SPARCS (Statewide Planning and Research Cooperative System), publicada por eldepartamento de salud del estado de Nueva York a través de su portal abierto. Se siguen los pasos de la metodología CRISP-DM para abordar el problema y una vez preparados los datos se procede a la modelización para encontrar el algoritmo que se ajuste más a la situación abordada. Seleccionado el set de variables más prometedor, se modeliza el costo del seguro a través de regresión lineal, modelos de aprendizaje automático basados en árboles, SVM y redes neuronales, evaluados mediante validación cruzada repetida con las métricas de rendimiento RMSE (Root Mean Square Error) y 𝑹𝟐 (coeficiente de determinación). Los resultados evidencian que el modelo XGBoost resulta ser el que ofrece mejor desempeño y, a través de la importancia de variables, permite interpretar la influencia de diferentes variables médicas, administrativas y demográficas en el coste, aportando evidencia útil para la toma de decisiones en contextos sanitarios y particulares como en Estados Unidos.spaPredicción del costo del seguro médico en el estado de Nueva York mediante técnicas de machine learningmaster thesisopen access519.2004.6Aprendizaje automáticoValidación cruzadaPredicción de costes sanitariosSelección de variablesMachine learningEstadísticaBases de datos (Informática)1209 Estadística1209.03 Análisis de Datos