Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Deep learning applied to turn-based board games

dc.contributor.advisorSánchez Ruiz-Granados, Antonio Alejandro
dc.contributor.authorSanz Sanz, Pablo
dc.contributor.authorVillanueva Quirós, Juan Carlos
dc.date.accessioned2023-06-17T10:53:55Z
dc.date.available2023-06-17T10:53:55Z
dc.date.issued2021
dc.degree.titleDoble Grado en Ingeniería Informatica-Matemáticas
dc.descriptionTrabajo fin de Grado en Doble Grado en Ingeniería Informatica-Matemáticas, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2020-2021
dc.description.abstractDue to the astonishing growth rate in computational power, artificial intelligence is achieving milestones that were considered as inconceivable just a few decades ago. One of them is AlphaZero, an algorithm capable of reaching superhuman performance in chess, shogi and Go, with just a few hours of self-play and given no domain knowledge except the game rules. In this paper, we review the fundamentals, explain how the algorithm works, and develop our own version of it, capable of being executed on a personal computer. Despite the lack of available computational resources, we have managed to master less complex games such as Tic-Tac-Toe and Connect 4. To verify learning, we test our implementation against other strategies and analyze the results obtained.
dc.description.abstractGracias al ritmo vertiginoso al que crece la capacidad computacional, la inteligencia artificial está ́logrando hitos que hace tan solo unas décadas se consideraban impensables. Uno de ellos es AlphaZero, un algoritmo capaz de alcanzar un nivel de juego sobrehumano en ajedrez, shogi y Go, mediante unas pocas horas de autoaprendizaje y sin conocimiento del dominio excepto las reglas del juego. En este trabajo, revisamos los fundamentos, explicamos cómo funciona el algoritmo y desarrollamos nuestra propia versión de este, capaz de ser ejecutada en un ordenador personal. A pesar de la escasez de recursos computacionales disponibles, hemos conseguido dominar juegos menos complejos como el Tres en Raya y el Conecta 4. Para verificar el aprendizaje, probamos nuestra implementación contra otras estrategias y analizamos los resultados obtenidos.
dc.description.departmentDepto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.eprint.idhttps://eprints.ucm.es/id/eprint/66895
dc.identifier.urihttps://hdl.handle.net/20.500.14352/10422
dc.language.isoeng
dc.page.total62
dc.rightsAtribución-NoComercial 3.0 España
dc.rights.accessRightsopen access
dc.rights.urihttps://creativecommons.org/licenses/by-nc/3.0/es/
dc.subject.cdu004(043.3)
dc.subject.keywordInteligencia artificial
dc.subject.keywordAlphaZero
dc.subject.keywordÁrboles de búsqueda de Monte Carlo
dc.subject.keywordAprendizaje por refuerzo
dc.subject.keywordAprendizaje profundo
dc.subject.keywordJuegos combinacionales. Artificial intelligence
dc.subject.keywordMonte Carlo tree search
dc.subject.keywordReinforcement learning
dc.subject.keywordDeep learning
dc.subject.keywordCombinational games.
dc.subject.keywordJuegos combinacionalesCombinational games.
dc.subject.ucmInformática (Informática)
dc.subject.unesco1203.17 Informática
dc.titleDeep learning applied to turn-based board games
dc.title.alternativeAprendizaje profundo aplicado a juegos de tablero por turnos
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication90c1631c-e546-4b8e-b5f2-c12ab516957c
relation.isAdvisorOfPublication.latestForDiscovery90c1631c-e546-4b8e-b5f2-c12ab516957c

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
SANZ SANZ 75354_PABLO_SANZ_SANZ_Aprendizaje_profundo_aplicado_a_juegos_de_tablero_por_turnos_784051_1794016224.pdf
Size:
2.02 MB
Format:
Adobe Portable Document Format