Para depositar en Docta Complutense, identifícate con tu correo @ucm.es en el SSO institucional. Haz clic en el desplegable de INICIO DE SESIÓN situado en la parte superior derecha de la pantalla. Introduce tu correo electrónico y tu contraseña de la UCM y haz clic en el botón MI CUENTA UCM, no autenticación con contraseña.

Predicción de la inactividad de locales comerciales en Madrid mediante técnicas de machine learning

dc.contributor.advisorRodríguez Cánovas, María Belén
dc.contributor.authorBazán Guardia, Alexandro
dc.date.accessioned2025-10-08T14:21:06Z
dc.date.available2025-10-08T14:21:06Z
dc.date.issued2025-09
dc.description.abstractEste Trabajo de Fin de Máster aborda la predicción del cierre de locales en la ciudad de Madrid, combinando datos administrativos del Ayuntamiento (2020–2024) enriquecidos con renta per cápita y población de cada área urbana. Se construyó una variable objetivo binaria (activo/inactivo) y se integraron más de ocho millones de registros, aplicando procesos de limpieza, estandarización y selección de variables (Boruta) antes del modelado. El conjunto de algoritmos evaluados incluye regresión logística, árboles de decisión, Random Forest, SVM, MLP, XGBoost, KNN y ensambles (Voting/Stacking), validados mediante validación cruzada estratificada y métricas. Los mejores resultados se obtuvieron con SVM, regresión logística, MLP y Voting. Las variables más determinantes fueron la renta media del entorno, el tipo de acceso (puerta de calle) y la pertenencia a determinadas secciones. Además, se identificaron patrones que permiten caracterizar los tipos de negocios más vulnerables y las zonas con mayor potencial de inversión en Madrid. El trabajo demuestra que modelos relativamente parsimoniosos, como el MLP compacto, ofrecen resultados robustos y estables, al tiempo que subraya la necesidad de mejorar la calidad de los datos. Como transferencia práctica, se propone desplegar una API interna y acompañar las predicciones con una explicación de estas con el método SHAP, lo que contribuirá tanto al Ayuntamiento de Madrid como a la ciudadanía, apoyando la toma de decisiones en política pública y la gestión comercial.
dc.description.abstractAbstract: This Master’s thesis addresses the prediction of business closures in the city of Madrid,combining administrative records from the City Council (2020–2024) enriched with per capita income and population data for each urban area. A binary target variable (active/inactive) was constructed and more than eight million records were integrated, followed by data cleaning, standardization, and feature selection (Boruta) prior to modeling. The set of evaluated algorithms includes logistic regression, decision trees, Random Forest, SVM, MLP, XGBoost, KNN, and ensemble methods (Voting/Stacking), validated through stratified cross-validation and standard metrics. The best results were achieved with SVM, logistic regression, MLP, and Voting. The most influential variables were neighborhood income, street-level access, and membership in specific territorial sections. In addition, patterns were identified that make it possible to characterize the types of businesses most vulnerable to closure and to highlight areas with greater investment potential across Madrid. The findings show that relatively parsimonious models, such as a compact MLP, can deliver robust and stable performance while also emphasizing the importance of improving data quality. As a practical contribution, the thesis proposes deploying an internal API and complementing predictions with explainability techniques (SHAP), thereby supporting decision-making for public policy and commercial management. Ultimately, the research provides value both to the Madrid City Council and to its citizens by guiding investment strategies and fostering sustainable urban development.
dc.description.departmentDepto. de Estadística y Ciencia de los Datos
dc.description.facultyFac. de Estudios Estadísticos
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/124673
dc.language.isospa
dc.master.titleMáster en Ciencia de Datos e Inteligencia de Negocios
dc.page.total79
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu311
dc.subject.cdu004.8
dc.subject.cdu658.8
dc.subject.cdu303
dc.subject.cdu658
dc.subject.keywordlocales
dc.subject.keywordaprendizaje automático
dc.subject.keyworddatos administrativos
dc.subject.keywordMadrid
dc.subject.keywordbusiness premises
dc.subject.keywordmachine learning
dc.subject.keywordadministrative data
dc.subject.ucmEstadística
dc.subject.ucmEstadísticas e indicadores sociales
dc.subject.ucmInteligencia artificial (Informática)
dc.subject.ucmInvestigación Comercial
dc.subject.ucmAdministración de empresas
dc.subject.unesco1209 Estadística
dc.subject.unesco1203.04 Inteligencia Artificial
dc.subject.unesco5304 Actividad Económica
dc.subject.unesco5311.02 Gestión Financiera
dc.titlePredicción de la inactividad de locales comerciales en Madrid mediante técnicas de machine learning
dc.typemaster thesis
dc.type.hasVersionAO
dspace.entity.typePublication
relation.isAdvisorOfPublicationf1cebb52-10d6-47ad-970c-bd9ac9211d3c
relation.isAdvisorOfPublication.latestForDiscoveryf1cebb52-10d6-47ad-970c-bd9ac9211d3c

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TFM-Alexandro Bazan Guardia.pdf
Size:
4.45 MB
Format:
Adobe Portable Document Format