Comparación de técnicas de detección de objetos en imágenes

Martín Pérez, José Luis

Comparación de técnicas de detección de objetos en imágenes

Download

TFMJoséLuisMartínPérez.pdf (5.95 MB)

Publication date

2023

Authors

Martín Pérez, José Luis

Advisors (or tutors)

Pajares Martínsanz, Gonzalo

Citations

Exportar

URI

https://hdl.handle.net/20.500.14352/88540

Abstract

El presente trabajo se sitúa en el campo del Aprendizaje Profundo (AP), donde los modelos de Redes Neuronales Artificiales han experimentado una notable evolución y se han convertido en elementos fundamentales para abordar desafíos de alta complejidad, tales como el reconocimiento de imágenes o el procesamiento del lenguaje natural. Este proyecto surge del interés en comprender en profundidad las técnicas de detección de objetos mediante AP. La detección de objetos es un método o técnica de visión artificial que permite reconocer y localizar objetos en imágenes o videos mediante Redes Neuronales Artificiales. Este trabajo se inicia con la selección y la posterior adaptación de un conjunto de datos que se utiliza para realizar el entrenamiento y la validación de los modelos. Para ello se ha realizado la implementación del detector de objetos de una etapa, You Only Look Once (YOLO), y de dos etapas, Regiones con CNN (R-CNN). Cada detector se ha entrenado y validado, utilizando como columnas vertebrales las arquitecturas de Redes Neuronales Artificiales AlexNet, MobileNetV2 y ResNet-50, con el fin de obtener el modelo con mejores resultados de cada detector de objetos. Finalmente, se trató de mejorar el modelo de mayor rendimiento de cada detector de objetos ajustando los hiperparámetros de estos.
This work is situated in the field of Deep Learning (DL), where Artificial Neural Network (ANN) models have evolved significantly and have become essential elements in addressing highly complex challenges, such as image recognition and natural language processing. This project arises from the interest in gaining a deep understanding of object detection techniques through DL. Object detection is a method or technique in computer vision that enables the recognition and localization of objects in images or videos using ANNs. This study begins with the selection and subsequent adaptation of a dataset, which is used for training and validating the models. For this purpose, have been implemented a single-stage and two-stage object detectors, YOLO and R-CNN respectively. Each object detector has been trained and validated, using the backbone architectures of the Artificial Neural Networks AlexNet, MobileNetV2, and ResNet-50, with the aim of obtaining the best-performing model for each object detector. Finally, an attempt to improve the results of the top-performing model of each object detector was made by fine-tuning the hyperparameters.

Description

Trabajo de Fin de Máster en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2022/2023. El código utilizado durante la realización de este trabajo se encuentra disponible en el repositorio on-line https://github.com/jlmpepe/tfm-project

UCM subjects

Informática (Informática)

Unesco subjects

33 Ciencias Tecnológicas

Collections

Trabajos Fin de Master (TFM)

Full item page

Comparación de técnicas de detección de objetos en imágenes

Download

Official URL

Full text at PDC

Publication date

Authors

Advisors (or tutors)

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations

Exportar

URI

Citation

Abstract

Research Projects

Organizational Units

Journal Issue

Description

UCM subjects

Unesco subjects

Keywords

Collections