Técnicas de IA para aprendizaje de comportamientos en el juego MsPacMan Vs. Ghost
Loading...
Official URL
Full text at PDC
Publication date
2022
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citation
Abstract
Una de las industrias que más relación guarda con la inteligencia artificial es la de los videojuegos. En nuestro caso hemos usado el juego MsPacMan Vs. Ghost como entorno de experimentación para el aprendizaje automático de comportamientos. En él hemos aplicado algunas de las técnicas de aprendizaje por refuerzo más populares, el Q-learning y el aprendizaje por refuerzo profundo.
La comprensión acerca del funcionamiento de ambos algoritmos la hemos realizado gracias al uso del entorno de OpenAI, Gym. Una vez entendidas las bases de cada tipo de agente hemos aplicado los conocimientos al problema que nos ocupaba.
A lo largo del proceso hemos ido sacando conclusiones y aprendiendo las ventajas e inconvenientes de cada técnica.
The videogame industry is one of the industries most closely related to artificial intelligence. In our case we have used MsPacMan Vs. Ghost as an experimental environment for automatic behavioral learning. This game has allowed us to apply some of the most popular reinforcement learning techniques, Q-learning and deep reinforcement learning. We have understood how both algorithms work by using the OpenAI environment, Gym. Once we understood the basics of each type of agent, we applied the new knowledge to our problem. Throughout the process we have been drawing conclusions and learning the advantages and disadvantages of each technique.
The videogame industry is one of the industries most closely related to artificial intelligence. In our case we have used MsPacMan Vs. Ghost as an experimental environment for automatic behavioral learning. This game has allowed us to apply some of the most popular reinforcement learning techniques, Q-learning and deep reinforcement learning. We have understood how both algorithms work by using the OpenAI environment, Gym. Once we understood the basics of each type of agent, we applied the new knowledge to our problem. Throughout the process we have been drawing conclusions and learning the advantages and disadvantages of each technique.
Description
Trabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 20221/2022.
El código de este proyecto es accesible a través de este enlace: https://github.com/UCM-GAIA/MsPacManEngine-RL