TY - THES AU - Hernández Roldán, Iván AU - Magarzo Gonzalo, Alejandro A3 - Palomino Tarjuelo, Miguel PY - 2023 UR - https://hdl.handle.net/20.500.14352/87700 AB - Como punto de partida, se abordan los fundamentos teóricos subyacentes a los bandidos multi-brazo, preparando así el terreno para la profundización en los bandidos contextuales. Los bandidos, como elemento fundamental en el aprendizaje por refuerzo,... AB - As a starting point, the theoretical foundations underlying multi-armed bandits are addressed, thereby laying the groundwork for a deep dive into contextual bandits. Bandits, as a fundamental element in reinforcement learning, provide an efficient... LA - spa KW - Bandidos multi-brazo KW - Exploración-explotación KW - Remordimiento KW - Bandidos estocásticos KW - Bandidos antagonistas KW - Bandidos contextuales KW - Clase política KW - Exp4 KW - Bots de comercio KW - Sistema recomendador KW - Multi-armed bandits KW - Exploration-exploitation KW - Regret KW - Stochastic bandits KW - Adversarial bandits KW - Contextual bandits KW - Policy class KW - Trading bots KW - Recommendation system TI - Bandidos Contextuales: Fundamentos y Aplicaciones T2 - Contextual Bandits: Foundations and Applications M3 - bachelor thesis ER -