Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Comparación de técnicas de detección de objetos en imágenes

Loading...
Thumbnail Image

Official URL

Full text at PDC

Publication date

2023

Advisors (or tutors)

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations
Google Scholar

Citation

Abstract

El presente trabajo se sitúa en el campo del Aprendizaje Profundo (AP), donde los modelos de Redes Neuronales Artificiales han experimentado una notable evolución y se han convertido en elementos fundamentales para abordar desafíos de alta complejidad, tales como el reconocimiento de imágenes o el procesamiento del lenguaje natural. Este proyecto surge del interés en comprender en profundidad las técnicas de detección de objetos mediante AP. La detección de objetos es un método o técnica de visión artificial que permite reconocer y localizar objetos en imágenes o videos mediante Redes Neuronales Artificiales. Este trabajo se inicia con la selección y la posterior adaptación de un conjunto de datos que se utiliza para realizar el entrenamiento y la validación de los modelos. Para ello se ha realizado la implementación del detector de objetos de una etapa, You Only Look Once (YOLO), y de dos etapas, Regiones con CNN (R-CNN). Cada detector se ha entrenado y validado, utilizando como columnas vertebrales las arquitecturas de Redes Neuronales Artificiales AlexNet, MobileNetV2 y ResNet-50, con el fin de obtener el modelo con mejores resultados de cada detector de objetos. Finalmente, se trató de mejorar el modelo de mayor rendimiento de cada detector de objetos ajustando los hiperparámetros de estos.
This work is situated in the field of Deep Learning (DL), where Artificial Neural Network (ANN) models have evolved significantly and have become essential elements in addressing highly complex challenges, such as image recognition and natural language processing. This project arises from the interest in gaining a deep understanding of object detection techniques through DL. Object detection is a method or technique in computer vision that enables the recognition and localization of objects in images or videos using ANNs. This study begins with the selection and subsequent adaptation of a dataset, which is used for training and validating the models. For this purpose, have been implemented a single-stage and two-stage object detectors, YOLO and R-CNN respectively. Each object detector has been trained and validated, using the backbone architectures of the Artificial Neural Networks AlexNet, MobileNetV2, and ResNet-50, with the aim of obtaining the best-performing model for each object detector. Finally, an attempt to improve the results of the top-performing model of each object detector was made by fine-tuning the hyperparameters.

Research Projects

Organizational Units

Journal Issue

Description

Trabajo de Fin de Máster en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2022/2023. El código utilizado durante la realización de este trabajo se encuentra disponible en el repositorio on-line https://github.com/jlmpepe/tfm-project

Keywords