Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Aprendizaje por refuerzo en videojuegos clásicos

dc.contributor.advisorDíaz Agudo, María Belén
dc.contributor.authorÁlvarez Iglesias, Álvaro
dc.date.accessioned2023-09-20T14:30:45Z
dc.date.available2023-09-20T14:30:45Z
dc.date.issued2023
dc.degree.titleGrado en Ingeniería Informática
dc.descriptionTrabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial (ISIA), Curso 2022/2023.
dc.description.abstractEl aprendizaje por refuerzo ya ha dominado la mayoría de los juegos arcade dando resultados incluso superiores a los de un jugador humano. Sin embargo, el cálculo de recompensas habitualmente hace uso de valores internos de la memoria RAM. En el caso del videojuego Tetris, podría tratarse del valor con la puntuación del jugador. Este método además de ser dependiente del juego en cuestión, no es comparable con la experiencia que tendría un jugador real. Además, existen situaciones en las que no es posible guiar el entrenamiento usando recompensas convencionales, como por ejemplo en los juegos de exploración. En su lugar, en este trabajo se propone hacer uso de las llamadas recompensas intrínsecas para entrenar un agente controlado por una red convolucional profunda usando únicamente la imagen. Las recompensas intrínsecas se suelen usar en conjunto con las clásicas, pero en esta ocasión se usarán de forma íntegra de forma que la implementación es independiente del juego en cuestión y más cercana a una experiencia humana. Los resultados muestran que la función de recompensa implementada da la suficiente información como para poder entrenar un agente que complete niveles de algunos videojuegos y que sea capaz de navegar los distintos escenarios.
dc.description.abstractReinforcement learning has already dominated most arcade games giving results even superior to those of a human player. However, reward calculation usually makes use of internal RAM values. In the case of the video game Tetris, this could be the value of the player’s score. This method, besides being dependent on the game in question, is not comparable to the experience that a real player would have. In addition, there are situations where it is not possible to guide training using conventional rewards, such as in exploration games. Instead, in this paper we propose to make use of so-called intrinsic rewards to train an agent controlled by a deep convolutional network using only the image. Intrinsic rewards are usually used in conjunction with classical rewards, but here they will be used in their entirety so that the implementation is independent of the game in question and closer to a human experience. The results show that the implemented reward function gives enough information to be able to train an agent to complete levels of some video games and to be able to navigate the different scenarios.
dc.description.departmentDepto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/87828
dc.language.isospa
dc.page.total70
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu004(043.3)
dc.subject.keywordReinforcement learning
dc.subject.keywordMachine learning
dc.subject.keywordNeural Networks
dc.subject.keywordPython
dc.subject.keywordIntrinsic rewards
dc.subject.keywordAprendizaje por refuerzo
dc.subject.keywordRed neuronal
dc.subject.keywordrecompensa intrínseca
dc.subject.ucmInformática (Informática)
dc.subject.unesco33 Ciencias Tecnológicas
dc.titleAprendizaje por refuerzo en videojuegos clásicos
dc.title.alternativeReinforcement Learning in classic games
dc.typebachelor thesis
dc.type.hasVersionAM
dspace.entity.typePublication
relation.isAdvisorOfPublication95de81bf-4637-4307-8ff6-f2c06c591d18
relation.isAdvisorOfPublication.latestForDiscovery95de81bf-4637-4307-8ff6-f2c06c591d18

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
85217_ALVARO_ALVAREZ_IGLESIAS_Aprendizaje_por_refuerzo_en_videojuegos_clasicos_2404368_332220682.pdf
Size:
3.61 MB
Format:
Adobe Portable Document Format