Sánchez Ruiz-Granados, Antonio AlejandroGómez Martín, Pedro PabloBravo Antón, RodrigoGarcía Rodríguez, JavierAlba Corral, David2023-06-172023-06-172018-09https://hdl.handle.net/20.500.14352/15111Universidad Complutense, Facultad de Informática. Departamento de Ingeniería del Software e Inteligencia Artificial, curso 2017/2018. Todo el software desarrollado para este trabajo está disponible en GitHub en la URL: https://github.com/robrav01/TFG-RLDLEn los últimos años, el Deep Reinforcement Learning se ha convertido en una de las ramas más prometedoras del área de la inteligencia arti cial. En este proyecto vamos a estudiar dicha rama y todos los componentes que la forman. Posteriormente, para aplicar los conocimientos adquiridos, programaremos un problema sencillo en el que un agente tiene que encontrar la salida en un mapa a modo de toma de contacto, y, a continuación, pondremos a prueba la corrección de la implementación de nuestro agente en un sistema de pruebas conocido internacionalmente como es OpenAI Gym. Todo el software desarrollado para este trabajo está disponible en GitHub en la URL: https://github.com/robrav01/TFG-RLDLIn the last few years, Deep Reinforcement Learning has become one of the most promising subjects in the Arti cial Intelligence area. In this project, we are going to study this subject and all the parts it is composed by. Later, for applying the acquired knowledge, we will program a simple problem in which an agent has to nd the exit in a map as a starting point, and, then, we will prove the correctness of the implementation of our agent in an internationally known test system as OpenAI Gym. All the software developed for this project is available on GitHub at the URL: https://github.com/robrav01/TFG-RLDLspaAtribución-NoComercial 3.0 Españahttps://creativecommons.org/licenses/by-nc/3.0/es/Jugadores automáticos basados en Deep Reinforcement Learningbachelor thesisopen access004(043.3)Deep Reinforcement LearningAprendizaje por refuerzoQ-LearningRedes neuronalesAprendizaje profundoDeepMindOpenAIConductismoReinforcement LearningNeural NetworksDeep LearningBehaviorismInformática (Informática)1203.17 Informática