Publication:
Reinforcement Learning: Theoretical Foundations and Application to the Rubik’s Cube

dc.contributor.advisorPalomino Tarjuelo, Miguel
dc.contributor.authorTardón Rubio, Carlos
dc.date.accessioned2023-06-16T13:23:43Z
dc.date.available2023-06-16T13:23:43Z
dc.date.issued2022-06
dc.degree.titleDoble Grado en Ingeniería Informática-Matemáticas
dc.descriptionTrabajo de Fin de Doble Grado en Ingeniería Informática y Matemáticas, Facultad de Informática UCM, Departamento de Sistemas Informáticos y Computación, Curso 2021/2022.
dc.description.abstractThe techniques employed and developed in the area of reinforcement learning have been evolving since their origins at the end of the 20th century. Thanks to the various advances in this field, it has been possible to solve increasingly complicated problems. The influence of other areas of machine learning and artificial intelligence has enabled applications of reinforcement learning that initially posed great challenges due to their computational requirements. One such problem is the one we will discuss in this work, which is characterized by a large state space and a single final state. First, a theoretical introduction to the area of reinforcement learning will be given, focusing on those aspects most relevant to the solution of our problem. Then, a theoretical description of the DeepCubeA algorithm will be presented, that was designed to solve the Rubik’s 3x3x3 Cube, which has a large state space and only one final state. Finally, we will design and implement a version of the DeepCubeA algorithm, adding some relevant aspects of its previous version (DeepCube), and we will study its behavior with the Rubik’s 2x2x2 and 3x3x3 Cubes, and the Hanoi Towers.
dc.description.abstractLas técnicas utilizadas y desarrolladas en el área del aprendizaje por refuerzo han ido evolucionando desde sus inicios, a finales del siglo XX. Gracias a los distintos avances en este sector, se han podido resolver problemas cada vez más complicados. La influencia de otras áreas del aprendizaje automático y de la inteligencia artificial han permitido aplicaciones del aprendizaje por refuerzo que inicialmente suponían grandes desafíos por sus requerimientos computacionales. Uno de esos problemas es el que trataremos en este trabajo, que se caracteriza por un gran espacio de estados y un único estado final. En un primer lugar, se dará una introducción teórica al área del aprendizaje por refuerzo, centrándonos en aquellos aspectos más relevantes en la resolución de nuestro problema. Después, se expondrá una descripción teórica del algoritmo DeepCubeA que fue diseñado especialmente para resolver el cubo de Rubik 3x3x3, caracterizado precisamente por un gran espacio de estados y un único estado final. Por último, diseñaremos e implementaremos una versión del algoritmo DeepCubeA, añadiendo algunos aspectos relevantes de su version anterior (DeepCube), y estudiaremos su comportamiento con los cubos de Rubik 2x2x2 y 3x3x3, y las Torres de Hanói.
dc.description.departmentDepto. de Sistemas Informáticos y Computación
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.eprint.idhttps://eprints.ucm.es/id/eprint/74353
dc.identifier.urihttps://hdl.handle.net/20.500.14352/3213
dc.language.isoeng
dc.page.total60
dc.rightsAtribución-NoComercial 3.0 España
dc.rights.accessRightsopen access
dc.rights.urihttps://creativecommons.org/licenses/by-nc/3.0/es/
dc.subject.cdu004(043.3)
dc.subject.keywordReinforcement learning
dc.subject.keywordRubik’s Cube
dc.subject.keywordTower of Hanoi
dc.subject.keywordNeural networks
dc.subject.keywordMachine learning
dc.subject.keywordA∗ search algorithm
dc.subject.keywordBWAS
dc.subject.keywordAprendizaje por refuerzo
dc.subject.keywordCubo de Rubik
dc.subject.keywordTorres de Hanói
dc.subject.keywordRedes neuronales
dc.subject.keywordAprendizaje automático
dc.subject.keywordAlgoritmo de búsqueda A*
dc.subject.ucmInformática (Informática)
dc.subject.unesco1203.17 Informática
dc.titleReinforcement Learning: Theoretical Foundations and Application to the Rubik’s Cube
dc.title.alternativeAprendizaje por Refuerzo: Fundamentos Teóricos y Aplicación al cubo de Rubik
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication52909b00-b705-4307-84db-d3211eedef69
relation.isAdvisorOfPublication.latestForDiscovery52909b00-b705-4307-84db-d3211eedef69
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TARDÓN RUBIO 57198_CARLOS_TARDON_RUBIO_Carlos_Tardon_Aprendizaje_por_Refuerzo_Fundamentos_Teoricos_y_Aplicacion_al_cubo_de_Rubik_1398832_565901567.pdf
Size:
3.82 MB
Format:
Adobe Portable Document Format