Sánchez Ruiz-Granados, Antonio AlejandroSanz Sanz, PabloVillanueva Quirós, Juan Carlos2023-06-172023-06-172021https://hdl.handle.net/20.500.14352/10422Trabajo fin de Grado en Doble Grado en Ingeniería Informatica-Matemáticas, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2020-2021Due to the astonishing growth rate in computational power, artificial intelligence is achieving milestones that were considered as inconceivable just a few decades ago. One of them is AlphaZero, an algorithm capable of reaching superhuman performance in chess, shogi and Go, with just a few hours of self-play and given no domain knowledge except the game rules. In this paper, we review the fundamentals, explain how the algorithm works, and develop our own version of it, capable of being executed on a personal computer. Despite the lack of available computational resources, we have managed to master less complex games such as Tic-Tac-Toe and Connect 4. To verify learning, we test our implementation against other strategies and analyze the results obtained.Gracias al ritmo vertiginoso al que crece la capacidad computacional, la inteligencia artificial está ́logrando hitos que hace tan solo unas décadas se consideraban impensables. Uno de ellos es AlphaZero, un algoritmo capaz de alcanzar un nivel de juego sobrehumano en ajedrez, shogi y Go, mediante unas pocas horas de autoaprendizaje y sin conocimiento del dominio excepto las reglas del juego. En este trabajo, revisamos los fundamentos, explicamos cómo funciona el algoritmo y desarrollamos nuestra propia versión de este, capaz de ser ejecutada en un ordenador personal. A pesar de la escasez de recursos computacionales disponibles, hemos conseguido dominar juegos menos complejos como el Tres en Raya y el Conecta 4. Para verificar el aprendizaje, probamos nuestra implementación contra otras estrategias y analizamos los resultados obtenidos.engAtribución-NoComercial 3.0 Españahttps://creativecommons.org/licenses/by-nc/3.0/es/Deep learning applied to turn-based board gamesAprendizaje profundo aplicado a juegos de tablero por turnosbachelor thesisopen access004(043.3)Inteligencia artificialAlphaZeroÁrboles de búsqueda de Monte CarloAprendizaje por refuerzoAprendizaje profundoJuegos combinacionales. Artificial intelligenceMonte Carlo tree searchReinforcement learningDeep learningCombinational games.Juegos combinacionalesCombinational games.Informática (Informática)1203.17 Informática