Jugadores automáticos basados en Deep Reinforcement Learning
dc.contributor.advisor | Sánchez Ruiz-Granados, Antonio Alejandro | |
dc.contributor.advisor | Gómez Martín, Pedro Pablo | |
dc.contributor.author | Bravo Antón, Rodrigo | |
dc.contributor.author | García Rodríguez, Javier | |
dc.contributor.author | Alba Corral, David | |
dc.date.accessioned | 2023-06-17T14:59:27Z | |
dc.date.available | 2023-06-17T14:59:27Z | |
dc.date.issued | 2018-09 | |
dc.description | Universidad Complutense, Facultad de Informática. Departamento de Ingeniería del Software e Inteligencia Artificial, curso 2017/2018. Todo el software desarrollado para este trabajo está disponible en GitHub en la URL: https://github.com/robrav01/TFG-RLDL | |
dc.description.abstract | En los últimos años, el Deep Reinforcement Learning se ha convertido en una de las ramas más prometedoras del área de la inteligencia arti cial. En este proyecto vamos a estudiar dicha rama y todos los componentes que la forman. Posteriormente, para aplicar los conocimientos adquiridos, programaremos un problema sencillo en el que un agente tiene que encontrar la salida en un mapa a modo de toma de contacto, y, a continuación, pondremos a prueba la corrección de la implementación de nuestro agente en un sistema de pruebas conocido internacionalmente como es OpenAI Gym. Todo el software desarrollado para este trabajo está disponible en GitHub en la URL: https://github.com/robrav01/TFG-RLDL | |
dc.description.abstract | In the last few years, Deep Reinforcement Learning has become one of the most promising subjects in the Arti cial Intelligence area. In this project, we are going to study this subject and all the parts it is composed by. Later, for applying the acquired knowledge, we will program a simple problem in which an agent has to nd the exit in a map as a starting point, and, then, we will prove the correctness of the implementation of our agent in an internationally known test system as OpenAI Gym. All the software developed for this project is available on GitHub at the URL: https://github.com/robrav01/TFG-RLDL | |
dc.description.department | Depto. de Ingeniería de Software e Inteligencia Artificial (ISIA) | |
dc.description.faculty | Fac. de Informática | |
dc.description.refereed | TRUE | |
dc.description.status | unpub | |
dc.eprint.id | https://eprints.ucm.es/id/eprint/50230 | |
dc.identifier.uri | https://hdl.handle.net/20.500.14352/15111 | |
dc.language.iso | spa | |
dc.page.total | 82 | |
dc.rights | Atribución-NoComercial 3.0 España | |
dc.rights.accessRights | open access | |
dc.rights.uri | https://creativecommons.org/licenses/by-nc/3.0/es/ | |
dc.subject.cdu | 004(043.3) | |
dc.subject.keyword | Deep Reinforcement Learning | |
dc.subject.keyword | Aprendizaje por refuerzo | |
dc.subject.keyword | Q-Learning | |
dc.subject.keyword | Redes neuronales | |
dc.subject.keyword | Aprendizaje profundo | |
dc.subject.keyword | DeepMind | |
dc.subject.keyword | OpenAI | |
dc.subject.keyword | Conductismo | |
dc.subject.keyword | Reinforcement Learning | |
dc.subject.keyword | Neural Networks | |
dc.subject.keyword | Deep Learning | |
dc.subject.keyword | Behaviorism | |
dc.subject.ucm | Informática (Informática) | |
dc.subject.unesco | 1203.17 Informática | |
dc.title | Jugadores automáticos basados en Deep Reinforcement Learning | |
dc.type | bachelor thesis | |
dspace.entity.type | Publication | |
relation.isAdvisorOfPublication | 90c1631c-e546-4b8e-b5f2-c12ab516957c | |
relation.isAdvisorOfPublication | ef9526b3-169c-4e45-b8f9-2e82965baecb | |
relation.isAdvisorOfPublication.latestForDiscovery | 90c1631c-e546-4b8e-b5f2-c12ab516957c |
Download
Original bundle
1 - 1 of 1