Aprendizaje máquina para la clasificación de  imágenes geolocalizadas

Saras González, Javier

Aprendizaje máquina para la clasificación de imágenes geolocalizadas

dc.contributor.advisor	Fuentes Fernández, Rubén
dc.contributor.author	Saras González, Javier
dc.date.accessioned	2025-09-17T13:05:55Z
dc.date.available	2025-09-17T13:05:55Z
dc.date.issued	2025
dc.degree.title	Doble Grado en Ingeniería Informática y Matemáticas
dc.description	Trabajo de Fin de Doble Grado en Ingeniería Informática y Matemáticas, Facultad Informática UCM. Dpto. de Ingeniería del Software e Inteligencia Artificial, Curso 2024/2025
dc.description.abstract	Determinar las coordenadas exactas de una imagen es una tarea visual sumamente compleja, resultando en un caso de estudio ideal para evaluar y desarrollar modelos de aprendizaje supervisado para tratar de resolver el problema. Para ello, se selecciona un amplio conjunto de datos etiquetado, equilibrado y representativo de la diversidad geográfica mundial; y se investigan maneras eficientes de gestionarlo y usarlo. El dataset se divide en entrenamiento, validación y test para, respectivamente, entrenar las redes neuronales, determinar cuándo parar dicho entrenamiento y evaluar el rendimiento final. Se propone una arquitectura que consta de un codificador de imágenes encargado de extraer características visuales relevantes, seguido de una red neuronal densa que estima la ubicación. Se exploran distintas configuraciones de parámetros y se definen varias funciones de pérdida para probar diferentes estrategias y ver cuál tiene un mejor desempeño, resultando en 36 modelos entrenados con la técnica early stopping para mitigar sobreajuste y subajuste. Después del entrenamiento, se evalúan los diferentes prototipos y se selecciona el que muestra un mejor desempeño en términos de consistencia en la precisión y en su capacidad de generalización ante nuevos datos, consiguiendo así un modelo competitivo con predicciones de menos de 900 km a más del 50 % del conjunto de test. Finalmente, se desarrolla una aplicación que integra ese modelo y permite estimar ubicaciones de nuevas imágenes. Todo el código asociado, los materiales adicionales y los modelos entrenados se pueden encontrar en https://drive.google.com/drive/folders/ 1YvVd-4UFtF6zzuGpNKgqjYX8kd002gRX?usp=sharing
dc.description.abstract	Determining the precise coordinates of an image is a highly complex visual task, making it an excellent case study for evaluating and developing supervised learning models aimed at solving this problem. To achieve this, a large, geotagged, well-balanced, and representative dataset reflecting the world’s geographic diversity is selected, and efficient methods to manage and use it are investigated. The dataset is divided into training, validation, and test sets, used respectively to train the neural networks, determine when to stop the training, and evaluate final performance. We propose an architecture composed of an image encoder responsible for extracting relevant features, followed by a dense neural network that estimates location. Different parameter configurations are explored, and several loss functions are defined to test different strategies and see which one performs better. This results in the training of 36 models, using the early stopping technique to mitigate overfitting and underfitting. After training, the different prototypes are evaluated, and the one showing the best performance in terms of accuracy and generalization to unseen data is selected, thus achieving a competitive model with prediction errors below 900 km in more than 50% of the test images. Finally, an application integrating the model is developed to allow location estimations of new images. All associated codes, additional materials, and trained models can be found at https://drive.google.com/drive/folders/1YvVd-4UFtF6zzuGpNKgqjYX8kd002gRX?usp=sharing
dc.description.department	Depto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.faculty	Fac. de Informática
dc.description.refereed	TRUE
dc.description.status	unpub
dc.identifier.uri	https://hdl.handle.net/20.500.14352/124066
dc.language.iso	spa
dc.page.total	122
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	en
dc.rights.accessRights	open access
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu	004(043.3)
dc.subject.keyword	Geolocalización de imágenes
dc.subject.keyword	Funciones de pérdida de geolocalización
dc.subject.keyword	Localizabilidad de imágenes
dc.subject.keyword	CLIP
dc.subject.keyword	Perceptrón multicapa
dc.subject.keyword	Image Geolocation
dc.subject.keyword	Geolocation Loss Functions
dc.subject.keyword	Image Localizability
dc.subject.keyword	CLIP
dc.subject.keyword	Multilayer Perceptron
dc.subject.ucm	Informática (Informática)
dc.subject.unesco	33 Ciencias Tecnológicas
dc.title	Aprendizaje máquina para la clasificación de imágenes geolocalizadas
dc.title	Classification of geolocated images using Machine learning
dc.type	bachelor thesis
dc.type.hasVersion	AM
dspace.entity.type	Publication
relation.isAdvisorOfPublication	1aecf3ea-fbdd-473c-9aac-dc620a2f688e
relation.isAdvisorOfPublication.latestForDiscovery	1aecf3ea-fbdd-473c-9aac-dc620a2f688e

Download

Original bundle

Now showing 1 - 1 of 1

Name:: Aprendizaje _máquina _ clasificación_imagenes.pdf
Size:: 28.62 MB
Format:: Adobe Portable Document Format

Download

Collections

Trabajos Fin de Grado (TFG) y Diplomas de Estudios Avanzados (DEA)