Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Implementación de Algoritmos de Aprendizaje por Refuerzo Avanzados para el Control en Espacio Continuo

dc.contributor.advisorFernández Fernández, Raúl
dc.contributor.authorPardos Medem, Pablo
dc.contributor.authorDubini Marqués, Carlo Sebastiano
dc.date.accessioned2024-07-12T14:05:47Z
dc.date.available2024-07-12T14:05:47Z
dc.date.issued2024
dc.degree.titleGrado en Ingeniería Informática / Grado en Ingeniería del Software
dc.descriptionTrabajo de Fin de Grado en Ingeniería Informática e Ingeniería del Software, Facultad de Informática UCM, Departamento de Arquitectura de Computadores y Automática, Curso 2023/2024. En este proyecto se ha utilizado un repositorio de Github para el desarrollo conjunto de la aplicación y el control de versiones, se encuentra en la siguiente url: https://github.com/CarloDubini/ReinforcementLearningTFG
dc.description.abstractEn la actualidad, el control automático se está introduciendo más en las tareas de la industria y de nuestras vidas, volviéndose algo muy común para ser el objeto de estudio de la implementación de técnicas de aprendizaje automático. Entre estas tareas destaca la aplicación a nuevas tareas complejas en espacio continuo, en concreto su aplicación en robótica y control automático. En este documento se abordan las diferentes características del aprendizaje por refuerzo y las redes neuronales, estudiando sus diferentes variantes y extensiones, subrayando su importancia en el aprendizaje automático y sus aplicaciones prácticas. Posteriormente se explican los métodos de Policy Gradient, responsables de tratar problemas en espacio continuo sin necesidad de discretizar el espacio, con énfasis en DDPG y HER dentro de estos. Estas técnicas han sido implementadas a lo largo de este trabajo de fin de grado para ejecutar el control de un péndulo y un brazo robot industrial. Con los datos posteriores al entrenamiento de este brazo robot en MuJoCo se han encontrado los parámetros que se consideran más importantes para el modelo. Se ha hecho una iteración sobre los posibles cambios a las estructuras, optimizadores y parámetros de control para realizar un análisis completo que permita más adelante añadir consideraciones de objetivos y obstáculos adicionales para un posible trabajo futuro. Por último, se ha diseñado la memoria de tal forma que se explican los pasos a seguir para su correcta implementación.
dc.description.abstractIn current times, automatic control is being introduced increasingly in the industrial processes and our lives, becoming something quite common to be the object of study through the implementation of machine learning techniques. Among these tasks and processes, complex tasks in continuous spaces stand out, highlighting its application in robotics and automatic control. This paper discusses the different characteristics of reinforcement learning and neural networks, studying their variants and extensions as we emphasize their importance in machine learning and their practical applications. Subsequently, Policy Gradient Methods are explained in detail, responsible for dealing with problems in continuous space without a real need for discretization, emphasizing DDPG and HER within these. These techniques have been implemented throughout this Bachelor’s Degree Final Project to execute the control of a pendulum and an industrial robot arm. With the data following the training of this robot arm in MuJoCo, we have found the parameters that are considered the most important for the robot arm by iterating on possible changes to the structures, optimizers, and control parameters to perform a complete analysis to add additional goals and obstacle considerations for future work. Finally, this paper has been designed to explain the steps that must be taken for its correct implementation.
dc.description.departmentDepto. de Arquitectura de Computadores y Automática
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.relatedurlhttps://github.com/CarloDubini/ReinforcementLearningTFG
dc.identifier.urihttps://hdl.handle.net/20.500.14352/106051
dc.language.isospa
dc.page.total120
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu004(043.3)
dc.subject.keywordAprendizaje por refuerzo
dc.subject.keywordDeep Learning
dc.subject.keywordRobótica
dc.subject.keywordAprendizaje automático
dc.subject.keywordRedes neuronales
dc.subject.keywordDeep Deterministic Policy Gradient
dc.subject.keywordHindsight Experience Replay
dc.subject.keywordReinforcement Learning
dc.subject.keywordRobotics
dc.subject.keywordMachine Learning
dc.subject.keywordNeural Networks
dc.subject.ucmInformática (Informática)
dc.subject.unesco33 Ciencias Tecnológicas
dc.titleImplementación de Algoritmos de Aprendizaje por Refuerzo Avanzados para el Control en Espacio Continuo
dc.title.alternativeApplication of Advanced Reinforcement Learning Algorithms for Continuous Control
dc.typebachelor thesis
dc.type.hasVersionAM
dspace.entity.typePublication

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
238937_2.PDF
Size:
2.82 MB
Format:
Adobe Portable Document Format