Aprendizaje máquina para la clasificación de imágenes geolocalizadas

dc.contributor.advisorFuentes Fernández, Rubén
dc.contributor.authorSaras González, Javier
dc.date.accessioned2025-09-17T13:05:55Z
dc.date.available2025-09-17T13:05:55Z
dc.date.issued2025
dc.degree.titleDoble Grado en Ingeniería Informática y Matemáticas
dc.descriptionTrabajo de Fin de Doble Grado en Ingeniería Informática y Matemáticas, Facultad Informática UCM. Dpto. de Ingeniería del Software e Inteligencia Artificial, Curso 2024/2025
dc.description.abstractDeterminar las coordenadas exactas de una imagen es una tarea visual sumamente compleja, resultando en un caso de estudio ideal para evaluar y desarrollar modelos de aprendizaje supervisado para tratar de resolver el problema. Para ello, se selecciona un amplio conjunto de datos etiquetado, equilibrado y representativo de la diversidad geográfica mundial; y se investigan maneras eficientes de gestionarlo y usarlo. El dataset se divide en entrenamiento, validación y test para, respectivamente, entrenar las redes neuronales, determinar cuándo parar dicho entrenamiento y evaluar el rendimiento final. Se propone una arquitectura que consta de un codificador de imágenes encargado de extraer características visuales relevantes, seguido de una red neuronal densa que estima la ubicación. Se exploran distintas configuraciones de parámetros y se definen varias funciones de pérdida para probar diferentes estrategias y ver cuál tiene un mejor desempeño, resultando en 36 modelos entrenados con la técnica early stopping para mitigar sobreajuste y subajuste. Después del entrenamiento, se evalúan los diferentes prototipos y se selecciona el que muestra un mejor desempeño en términos de consistencia en la precisión y en su capacidad de generalización ante nuevos datos, consiguiendo así un modelo competitivo con predicciones de menos de 900 km a más del 50 % del conjunto de test. Finalmente, se desarrolla una aplicación que integra ese modelo y permite estimar ubicaciones de nuevas imágenes. Todo el código asociado, los materiales adicionales y los modelos entrenados se pueden encontrar en https://drive.google.com/drive/folders/ 1YvVd-4UFtF6zzuGpNKgqjYX8kd002gRX?usp=sharing
dc.description.abstractDetermining the precise coordinates of an image is a highly complex visual task, making it an excellent case study for evaluating and developing supervised learning models aimed at solving this problem. To achieve this, a large, geotagged, well-balanced, and representative dataset reflecting the world’s geographic diversity is selected, and efficient methods to manage and use it are investigated. The dataset is divided into training, validation, and test sets, used respectively to train the neural networks, determine when to stop the training, and evaluate final performance. We propose an architecture composed of an image encoder responsible for extracting relevant features, followed by a dense neural network that estimates location. Different parameter configurations are explored, and several loss functions are defined to test different strategies and see which one performs better. This results in the training of 36 models, using the early stopping technique to mitigate overfitting and underfitting. After training, the different prototypes are evaluated, and the one showing the best performance in terms of accuracy and generalization to unseen data is selected, thus achieving a competitive model with prediction errors below 900 km in more than 50% of the test images. Finally, an application integrating the model is developed to allow location estimations of new images. All associated codes, additional materials, and trained models can be found at https://drive.google.com/drive/folders/1YvVd-4UFtF6zzuGpNKgqjYX8kd002gRX?usp=sharing
dc.description.departmentDepto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/124066
dc.language.isospa
dc.page.total122
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu004(043.3)
dc.subject.keywordGeolocalización de imágenes
dc.subject.keywordFunciones de pérdida de geolocalización
dc.subject.keywordLocalizabilidad de imágenes
dc.subject.keywordCLIP
dc.subject.keywordPerceptrón multicapa
dc.subject.keywordImage Geolocation
dc.subject.keywordGeolocation Loss Functions
dc.subject.keywordImage Localizability
dc.subject.keywordCLIP
dc.subject.keywordMultilayer Perceptron
dc.subject.ucmInformática (Informática)
dc.subject.unesco33 Ciencias Tecnológicas
dc.titleAprendizaje máquina para la clasificación de imágenes geolocalizadas
dc.titleClassification of geolocated images using Machine learning
dc.typebachelor thesis
dc.type.hasVersionAM
dspace.entity.typePublication
relation.isAdvisorOfPublication1aecf3ea-fbdd-473c-9aac-dc620a2f688e
relation.isAdvisorOfPublication.latestForDiscovery1aecf3ea-fbdd-473c-9aac-dc620a2f688e

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Aprendizaje _máquina _ clasificación_imagenes.pdf
Size:
28.62 MB
Format:
Adobe Portable Document Format