Perspectiva del DoubleDQN en los sistemas de recomendación para resolver el problema de item cold-start

Shu, Ziwei

Perspectiva del DoubleDQN en los sistemas de recomendación para resolver el problema de item cold-start

Download

zwei-shu_perspectiva_tfm.pdf (4.69 MB)

Publication date

2021

Defense date

2021

Authors

Shu, Ziwei

Advisors (or tutors)

Carrasco González, Ramón Alberto

Citations

Exportar

URI

https://hdl.handle.net/20.500.14352/9198

Abstract

Los sistemas de recomendación se utilizan ampliamente en nuestra vida. Por ejemplo, se recomiendan unos productos que le pueden interesar a partir de su historial de compra o visitas (Amazon); unas películas que le puedan gustar según su popularidad (Netflix), etc. De hecho, esos no solo ayudan a los consumidores a encontrar productos que les puedan interesar, sino que también permiten a las empresas a atraer y retener a más clientes. Muchas empresas aplican el filtrado colaborativo en sus sistemas de recomendación para proporcionar una lista de elementos potenciales a cada usuario. No obstante, la mayoría de los modelos del filtrado colaborativo no tienen en cuenta los cambios dinámicos de las preferencias de los usuarios y hacen recomendaciones siguiendo una estrategia estática. Otro problema grave del filtrado colaborativo es el arranque en frío (cold-start, en inglés), que ocurre cuando el sistema de recomendación no ha sido capaz de detectar los productos similares debido a la falta de la información de los comportamientos de usuarios o la calificación de productos. En consecuencia, el objetivo de este trabajo es diseñar un novedoso algoritmo de recomendación basado ene l aprendizaje por refuerzo (Reinforcement Learning, en inglés), que favorece encontrar automáticamente la estrategia óptima de recomendación mediante las interacciones continuas con los usuarios. Al mismo tiempo, verificaría si éste tuviera capacidad de resolver el problema de item cold-start y el efecto temporal de las recomendaciones. Se han usado 2 conjuntos de datos de MovieLens, uno de 610 usuarios que puntuaron 9724 películas en la plataforma MovieLens entre el 29 de marzo de 996 y el 24 de septiembre de 2018 (MovieLensSLD), y el otro de 943 usuarios que puntuaron 1682 películas antes del año 1999 (MOvieLens 100K). Se han depurado los datos a través de SAS Miner, y posteriormente los analizaron con Python mediante los algoritmos clásicos de sistemas de recomendación, el algoritmo Deep Q Network (en adelante DQN) y Double Deep Q-Network (en adelante DoubleDQN) con el fin de comparar sus rendimientos en cada conjunto de dato.

UCM subjects

Estadística, Investigación Comercial

Unesco subjects

1209 Estadística

Collections

Trabajos Fin de Master (TFM)

Full item page

Perspectiva del DoubleDQN en los sistemas de recomendación para resolver el problema de item cold-start

Download

Official URL

Full text at PDC

Publication date

Defense date

Authors

Advisors (or tutors)

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations

Exportar

URI

Citation

Abstract

Research Projects

Organizational Units

Journal Issue

Description

UCM subjects

Unesco subjects

Keywords

Collections