Rodríguez Cánovas, María BelénBazán Guardia, Alexandro2025-10-082025-10-082025-09https://hdl.handle.net/20.500.14352/124673Este Trabajo de Fin de Máster aborda la predicción del cierre de locales en la ciudad de Madrid, combinando datos administrativos del Ayuntamiento (2020–2024) enriquecidos con renta per cápita y población de cada área urbana. Se construyó una variable objetivo binaria (activo/inactivo) y se integraron más de ocho millones de registros, aplicando procesos de limpieza, estandarización y selección de variables (Boruta) antes del modelado. El conjunto de algoritmos evaluados incluye regresión logística, árboles de decisión, Random Forest, SVM, MLP, XGBoost, KNN y ensambles (Voting/Stacking), validados mediante validación cruzada estratificada y métricas. Los mejores resultados se obtuvieron con SVM, regresión logística, MLP y Voting. Las variables más determinantes fueron la renta media del entorno, el tipo de acceso (puerta de calle) y la pertenencia a determinadas secciones. Además, se identificaron patrones que permiten caracterizar los tipos de negocios más vulnerables y las zonas con mayor potencial de inversión en Madrid. El trabajo demuestra que modelos relativamente parsimoniosos, como el MLP compacto, ofrecen resultados robustos y estables, al tiempo que subraya la necesidad de mejorar la calidad de los datos. Como transferencia práctica, se propone desplegar una API interna y acompañar las predicciones con una explicación de estas con el método SHAP, lo que contribuirá tanto al Ayuntamiento de Madrid como a la ciudadanía, apoyando la toma de decisiones en política pública y la gestión comercial.Abstract: This Master’s thesis addresses the prediction of business closures in the city of Madrid,combining administrative records from the City Council (2020–2024) enriched with per capita income and population data for each urban area. A binary target variable (active/inactive) was constructed and more than eight million records were integrated, followed by data cleaning, standardization, and feature selection (Boruta) prior to modeling. The set of evaluated algorithms includes logistic regression, decision trees, Random Forest, SVM, MLP, XGBoost, KNN, and ensemble methods (Voting/Stacking), validated through stratified cross-validation and standard metrics. The best results were achieved with SVM, logistic regression, MLP, and Voting. The most influential variables were neighborhood income, street-level access, and membership in specific territorial sections. In addition, patterns were identified that make it possible to characterize the types of businesses most vulnerable to closure and to highlight areas with greater investment potential across Madrid. The findings show that relatively parsimonious models, such as a compact MLP, can deliver robust and stable performance while also emphasizing the importance of improving data quality. As a practical contribution, the thesis proposes deploying an internal API and complementing predictions with explainability techniques (SHAP), thereby supporting decision-making for public policy and commercial management. Ultimately, the research provides value both to the Madrid City Council and to its citizens by guiding investment strategies and fostering sustainable urban development.spaAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Predicción de la inactividad de locales comerciales en Madrid mediante técnicas de machine learningmaster thesisopen access311004.8658.8303658localesaprendizaje automáticodatos administrativosMadridbusiness premisesmachine learningadministrative dataEstadísticaEstadísticas e indicadores socialesInteligencia artificial (Informática)Investigación ComercialAdministración de empresas1209 Estadística1203.04 Inteligencia Artificial5304 Actividad Económica5311.02 Gestión Financiera