Sánchez Ruiz-Granados, Antonio AlejandroArranz Janeiro, RicardoConcepción Echeverría, LidiaCaño Vega, Juan Ramón delPonce Belmonte, FranciscoRomero Sánchez, Juan Luis2023-06-172023-06-172019https://hdl.handle.net/20.500.14352/15225Todo el código fuente referente a este proyecto puede encontrarse en: https://github.com/delcanovega/TFG-DRL Trabajo de Fin de Grado, Universidad Complutense, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2018/2019En este proyecto estudiaremos el campo del aprendizaje por refuerzo profundo, con el objetivo de lograr una aplicación estable en problemas clásicos de control. Para lograrlo investigaremos sus bases: el aprendizaje por refuerzo y las redes neuronales, comprobando cuáles son sus puntos fuertes y débiles. Después combinaremos lo aprendido para, progresivamente, mejorar el rendimiento y la estabilidad de nuestros agentes. En busca de una mayor comprensión de su funcionamiento, todas las implementaciones de los agentes y algoritmos serán hechas por nosotros mismos. Todo ello será puesto a prueba a través del conocido sistema OpenAI Gym. Todo el código fuente referente a este proyecto puede encontrarse en: https://github.com/delcanovega/TFG-DRLIn this project we will study the Deep Reinforcement Learning field in order to achieve an stable application for classic control problems. To do this we will investigate its fundamentals: Reinforcement Learning and Neural Networks, learning which are their strengths and weaknesses. Finally, we will merge both to progressivly improve our agent’s performance and stability. In order to gain a better insight we will personally implement the agents and algorithms. All of this will be tested through the popular framework OpenAI Gym. This project’s source code can be found in the repository: https://github.com/delcanovega/TFG-DRLspaAtribución-NoComercial 3.0 Españahttps://creativecommons.org/licenses/by-nc/3.0/es/Aprendizaje por refuerzo profundo aplicado a juegos sencillosbachelor thesishttps://github.com/delcanovega/TFG-DRLopen access004 (043.3)Aprendizaje por refuerzoQ-LearningProceso de MárkovRedes neuronalesAprendizaje por refuerzo profundoDeepMindOpenAIReinforcement LearningMarkov decision processNeural NetworksDeep Reinforcement LearningInformática (Informática)1203.17 Informática