Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Aprendizaje por refuerzo para la mejora de calidad de servicio en procesos de codificación de vídeo

dc.contributor.advisorOlcoz Herrero, Katzalin
dc.contributor.advisorCostero Valero, Luis María
dc.contributor.authorSimarro Guerra, Pedro
dc.date.accessioned2023-06-16T14:57:00Z
dc.date.available2023-06-16T14:57:00Z
dc.date.issued2021-09
dc.degree.titleGrado en Ingeniería Informática
dc.descriptionTrabajo Fin de Grado en Ingeniaría Informática, Facultad de Informática UCM, Departamento de Arquitectura de Computadores y Automática, Curso 2020/2021.
dc.description.abstractEl aprendizaje por refuerzo es uno de los tres grandes paradigmas de la inteligencia artificial junto al aprendizaje supervisado y al no supervisado. Su uso se ha extendido a lo largo de los años y se ha demostrado su eficacia en áreas como la robótica, el trading financiero o incluso en la simulación de videojuegos. Está enfocado principalmente a problemas de optimización, problemas que normalmente son difíciles de resolver y necesitan de un gran despliegue en recursos humanos y técnicos para encontrar una solución. Es por eso por lo que existe la posibilidad de crear un sistema de aprendizaje artificial como es el del aprendizaje por refuerzo que nos facilita la tarea, abaratando costes y automatizando el proceso. En este trabajo se realizó un estudio sobre el aprendizaje por refuerzo y su aplicación en un ejemplo de uso concreto, la optimización de recursos de un procesador para la ejecución de Kvazaar, un codificador de vídeo de código abierto. La tarea consistió en crear un sistema agente-entorno típico del paradigma de aprendizaje por refuerzo usando las librerías RLLIB, una API que proporciona las herramientas crear agentes de aprendizaje por refuerzo y GYM, una librería para crear entornos. A partir de ahí, se discutieron los resultados de tal modo que se siguiese ajustando el modelo hasta llegar a nuestro objetivo anteriormente mencionado.
dc.description.abstractReinforcement learning is one of the three most important artificial intelligence paradigms alongside supervised learning and non-supervised learning. Its use has been growing meaningfully in areas such as robotics, financial trading, or videogames simulation. It is thought towards optimization problems, problems that are usually hard to solve and need lots of computational and human resources. That is why creating a reinforcement learning environment helps saving costs and automate the process. This project is an investigation about the reinforcement learning paradigm and its application on a specific use case, resources optimization of a CPU in Kvazaar’s execution, an open-source video encoder. The main task was to develop an agent-environment system using RLLIB, an API that brings all the needed tools for creating agents and GYM, a library that standardizes environments. From that, results were discussed to adjust the model until getting the objective, the optimization of CPU resources to get the above-mentioned objective.
dc.description.departmentDepto. de Arquitectura de Computadores y Automática
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.eprint.idhttps://eprints.ucm.es/id/eprint/68664
dc.identifier.urihttps://hdl.handle.net/20.500.14352/5370
dc.language.isospa
dc.page.total63
dc.rightsAtribución-NoComercial 3.0 España
dc.rights.accessRightsopen access
dc.rights.urihttps://creativecommons.org/licenses/by-nc/3.0/es/
dc.subject.cdu004(043.3)
dc.subject.keywordAprendizaje por refuerzo
dc.subject.keywordRecompensa
dc.subject.keywordPolítica
dc.subject.keywordGYM
dc.subject.keywordRLLIB
dc.subject.keywordEntorno
dc.subject.keywordEstado
dc.subject.keywordAcción
dc.subject.keywordKvazaar
dc.subject.keywordMulticore.
dc.subject.keywordReinforcement learning
dc.subject.keywordReward
dc.subject.keywordPolicy
dc.subject.keywordState
dc.subject.keywordAction
dc.subject.keywordEnvironment
dc.subject.ucmInformática (Informática)
dc.subject.unesco1203.17 Informática
dc.titleAprendizaje por refuerzo para la mejora de calidad de servicio en procesos de codificación de vídeo
dc.title.alternativeImproving quality of service for video coding using reinforcement learning
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication8cfc18ec-4816-404d-982d-21dc07318c07
relation.isAdvisorOfPublicationb2616c88-d3da-43df-86cb-3ced1084f460
relation.isAdvisorOfPublication.latestForDiscovery8cfc18ec-4816-404d-982d-21dc07318c07

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
SIMARRO GUERRA 84548_PEDRO_SIMARRO_GUERRA_Pedro_Simarro_Guerra_-_APRENDIZAJE_POR_REFUERZO_PARA_LA_MEJORA_DE_CALIDAD_DE_SERVICIO_EN_PROCESOS_DE_CODIFICACION_DE_1602271529.pdf
Size:
2.74 MB
Format:
Adobe Portable Document Format