RT Generic
T1 Extendiendo Darmok, un sistema de planificación basada en casos, mediante Árboles de comportamiento
A1 Palma Durán, Ricardo
AB La combinación de aprendizaje automático y planificación ha demostrado ser una buena solución para los juegos de estrategia en tiempo real. Sin embargo, aprender planes jerárquicos a partir de trazas (demostraciones) deexpertos tiene también sus limitaciones, en particular el número de trazas de entrenamiento necesitadas, así como la ausencia de mecanismos para reaccionar rápidamente ante objetivos de alta prioridad. En este trabajo proponemosque el diseñador defina de manera explícita conocimiento para la toma de decisiones en forma de árboles de comportamiento, para así complementar el conocimiento obtenido a partir de las trazas. Proporcionando un mecanismonatural para que los diseñadores inyecten conocimiento en la librería de planes, pretendemos integrar lo mejor de ambos enfoques: aprendizaje de trazas y reglas codificadas a mano. En este trabajo extendemos un sistema de planificación basada en casos, Darmok, para resolver algunos de sus problemas más importantes. Darmok, que fue diseñado para jugar a juegos de estrategia en tiempo real, tiene algunas deficiencias en lo que respecta a su capacidad de reactividad. En concreto, puede ser o demasiado reactivo cuando ejecuta algunos planes, o demasiado no-reactivo en la ejecución de algunas acciones de bajo nivel, lo cual en su conjunto hace que su rendimiento se deteriore en algunos escenarios bastantefrecuentes. Mediante el uso de conocimiento experto en forma de árboles de comportamiento, pretendemos solventar estos problemas.[ABSTRACT]The combination of learning and planning has proved an efective solution for real-time strategy games. Nevertheless, learning hierarchical plans from expert traces also has its limitations, regarding the number of training traces required, and the absence of mechanisms for rapidly reacting to high priority goals. We propose to bring the game designer back into the loop, by allowinghim to explicitly inject decision making knowledge, in the form of behavior trees, to complement the knowledge obtained from the traces. By providing a natural mechanism for designers to inject knowledge into the plan library,we intend to integrate the best of both worlds: learning from traces and hardcoded rules. In this work we extend a well known case-based planning system, Darmok, to overcome some of its most important  aws. Darmok, initially designed to play real-time strategy games, does have some problems concerning its reactivity capabilities. In particular, it can be either too reactive when executing some plans, or too non-reactive when executing some low level actions, which makes its performance greately deteriorate in some scenarios. By using expert knowledge in the form of behaviour trees, we intend to overcome these problems.
YR 2010
FD 2010
LK https://hdl.handle.net/20.500.14352/46267
UL https://hdl.handle.net/20.500.14352/46267
LA spa
NO Máster en Investigación en Informática, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial, curso 2009-2010
DS Docta Complutense
RD 17 mar 2026