Aprendizaje máquina para la clasificación de imágenes geolocalizadas
| dc.contributor.advisor | Fuentes Fernández, Rubén | |
| dc.contributor.author | Saras González, Javier | |
| dc.date.accessioned | 2025-09-17T13:05:55Z | |
| dc.date.available | 2025-09-17T13:05:55Z | |
| dc.date.issued | 2025 | |
| dc.degree.title | Doble Grado en Ingeniería Informática y Matemáticas | |
| dc.description | Trabajo de Fin de Doble Grado en Ingeniería Informática y Matemáticas, Facultad Informática UCM. Dpto. de Ingeniería del Software e Inteligencia Artificial, Curso 2024/2025 | |
| dc.description.abstract | Determinar las coordenadas exactas de una imagen es una tarea visual sumamente compleja, resultando en un caso de estudio ideal para evaluar y desarrollar modelos de aprendizaje supervisado para tratar de resolver el problema. Para ello, se selecciona un amplio conjunto de datos etiquetado, equilibrado y representativo de la diversidad geográfica mundial; y se investigan maneras eficientes de gestionarlo y usarlo. El dataset se divide en entrenamiento, validación y test para, respectivamente, entrenar las redes neuronales, determinar cuándo parar dicho entrenamiento y evaluar el rendimiento final. Se propone una arquitectura que consta de un codificador de imágenes encargado de extraer características visuales relevantes, seguido de una red neuronal densa que estima la ubicación. Se exploran distintas configuraciones de parámetros y se definen varias funciones de pérdida para probar diferentes estrategias y ver cuál tiene un mejor desempeño, resultando en 36 modelos entrenados con la técnica early stopping para mitigar sobreajuste y subajuste. Después del entrenamiento, se evalúan los diferentes prototipos y se selecciona el que muestra un mejor desempeño en términos de consistencia en la precisión y en su capacidad de generalización ante nuevos datos, consiguiendo así un modelo competitivo con predicciones de menos de 900 km a más del 50 % del conjunto de test. Finalmente, se desarrolla una aplicación que integra ese modelo y permite estimar ubicaciones de nuevas imágenes. Todo el código asociado, los materiales adicionales y los modelos entrenados se pueden encontrar en https://drive.google.com/drive/folders/ 1YvVd-4UFtF6zzuGpNKgqjYX8kd002gRX?usp=sharing | |
| dc.description.abstract | Determining the precise coordinates of an image is a highly complex visual task, making it an excellent case study for evaluating and developing supervised learning models aimed at solving this problem. To achieve this, a large, geotagged, well-balanced, and representative dataset reflecting the world’s geographic diversity is selected, and efficient methods to manage and use it are investigated. The dataset is divided into training, validation, and test sets, used respectively to train the neural networks, determine when to stop the training, and evaluate final performance. We propose an architecture composed of an image encoder responsible for extracting relevant features, followed by a dense neural network that estimates location. Different parameter configurations are explored, and several loss functions are defined to test different strategies and see which one performs better. This results in the training of 36 models, using the early stopping technique to mitigate overfitting and underfitting. After training, the different prototypes are evaluated, and the one showing the best performance in terms of accuracy and generalization to unseen data is selected, thus achieving a competitive model with prediction errors below 900 km in more than 50% of the test images. Finally, an application integrating the model is developed to allow location estimations of new images. All associated codes, additional materials, and trained models can be found at https://drive.google.com/drive/folders/1YvVd-4UFtF6zzuGpNKgqjYX8kd002gRX?usp=sharing | |
| dc.description.department | Depto. de Ingeniería de Software e Inteligencia Artificial (ISIA) | |
| dc.description.faculty | Fac. de Informática | |
| dc.description.refereed | TRUE | |
| dc.description.status | unpub | |
| dc.identifier.uri | https://hdl.handle.net/20.500.14352/124066 | |
| dc.language.iso | spa | |
| dc.page.total | 122 | |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.accessRights | open access | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.cdu | 004(043.3) | |
| dc.subject.keyword | Geolocalización de imágenes | |
| dc.subject.keyword | Funciones de pérdida de geolocalización | |
| dc.subject.keyword | Localizabilidad de imágenes | |
| dc.subject.keyword | CLIP | |
| dc.subject.keyword | Perceptrón multicapa | |
| dc.subject.keyword | Image Geolocation | |
| dc.subject.keyword | Geolocation Loss Functions | |
| dc.subject.keyword | Image Localizability | |
| dc.subject.keyword | CLIP | |
| dc.subject.keyword | Multilayer Perceptron | |
| dc.subject.ucm | Informática (Informática) | |
| dc.subject.unesco | 33 Ciencias Tecnológicas | |
| dc.title | Aprendizaje máquina para la clasificación de imágenes geolocalizadas | |
| dc.title | Classification of geolocated images using Machine learning | |
| dc.type | bachelor thesis | |
| dc.type.hasVersion | AM | |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | 1aecf3ea-fbdd-473c-9aac-dc620a2f688e | |
| relation.isAdvisorOfPublication.latestForDiscovery | 1aecf3ea-fbdd-473c-9aac-dc620a2f688e |
Download
Original bundle
1 - 1 of 1
Loading...
- Name:
- Aprendizaje _máquina _ clasificación_imagenes.pdf
- Size:
- 28.62 MB
- Format:
- Adobe Portable Document Format


