Perspectiva del DoubleDQN en los sistemas de recomendación para resolver el problema de item cold-start

Shu, Ziwei

Perspectiva del DoubleDQN en los sistemas de recomendación para resolver el problema de item cold-start

dc.contributor.advisor	Carrasco González, Ramón Alberto
dc.contributor.author	Shu, Ziwei
dc.date.accessioned	2023-06-17T10:17:57Z
dc.date.available	2023-06-17T10:17:57Z
dc.date.defense	2021
dc.date.issued	2021
dc.description.abstract	Los sistemas de recomendación se utilizan ampliamente en nuestra vida. Por ejemplo, se recomiendan unos productos que le pueden interesar a partir de su historial de compra o visitas (Amazon); unas películas que le puedan gustar según su popularidad (Netflix), etc. De hecho, esos no solo ayudan a los consumidores a encontrar productos que les puedan interesar, sino que también permiten a las empresas a atraer y retener a más clientes. Muchas empresas aplican el filtrado colaborativo en sus sistemas de recomendación para proporcionar una lista de elementos potenciales a cada usuario. No obstante, la mayoría de los modelos del filtrado colaborativo no tienen en cuenta los cambios dinámicos de las preferencias de los usuarios y hacen recomendaciones siguiendo una estrategia estática. Otro problema grave del filtrado colaborativo es el arranque en frío (cold-start, en inglés), que ocurre cuando el sistema de recomendación no ha sido capaz de detectar los productos similares debido a la falta de la información de los comportamientos de usuarios o la calificación de productos. En consecuencia, el objetivo de este trabajo es diseñar un novedoso algoritmo de recomendación basado ene l aprendizaje por refuerzo (Reinforcement Learning, en inglés), que favorece encontrar automáticamente la estrategia óptima de recomendación mediante las interacciones continuas con los usuarios. Al mismo tiempo, verificaría si éste tuviera capacidad de resolver el problema de item cold-start y el efecto temporal de las recomendaciones. Se han usado 2 conjuntos de datos de MovieLens, uno de 610 usuarios que puntuaron 9724 películas en la plataforma MovieLens entre el 29 de marzo de 996 y el 24 de septiembre de 2018 (MovieLensSLD), y el otro de 943 usuarios que puntuaron 1682 películas antes del año 1999 (MOvieLens 100K). Se han depurado los datos a través de SAS Miner, y posteriormente los analizaron con Python mediante los algoritmos clásicos de sistemas de recomendación, el algoritmo Deep Q Network (en adelante DQN) y Double Deep Q-Network (en adelante DoubleDQN) con el fin de comparar sus rendimientos en cada conjunto de dato.
dc.description.department	Unidad Docente de Organización de Empresas y Marketing
dc.description.faculty	Fac. de Estudios Estadísticos
dc.description.refereed	FALSE
dc.description.status	submitted
dc.eprint.id	https://eprints.ucm.es/id/eprint/66311
dc.identifier.uri	https://hdl.handle.net/20.500.14352/9198
dc.language.iso	spa
dc.master.title	Máster en Minería de Datos e Inteligencia de Negocios
dc.rights	Atribución 3.0 España
dc.rights.accessRights	open access
dc.rights.uri	https://creativecommons.org/licenses/by/3.0/es/
dc.subject.cdu	004.738.52:338.46
dc.subject.keyword	Algoritmos
dc.subject.keyword	Sistemas de recomendación (Informática)
dc.subject.keyword	Reinforcement learning
dc.subject.keyword	Deep Q-Network
dc.subject.keyword	Double Deep Q-Network
dc.subject.keyword	Recommender systems (Information filtering)
dc.subject.ucm	Estadística
dc.subject.ucm	Investigación Comercial
dc.subject.unesco	1209 Estadística
dc.title	Perspectiva del DoubleDQN en los sistemas de recomendación para resolver el problema de item cold-start
dc.type	master thesis
dspace.entity.type	Publication
relation.isAdvisorOfPublication	658b3e73-df89-4013-b006-45ea9db05e25
relation.isAdvisorOfPublication.latestForDiscovery	658b3e73-df89-4013-b006-45ea9db05e25
relation.isAuthorOfPublication	0e904bac-aeb9-4021-a28d-d21856ac0c5b
relation.isAuthorOfPublication.latestForDiscovery	0e904bac-aeb9-4021-a28d-d21856ac0c5b

Download

Original bundle

Now showing 1 - 1 of 1

Name:: zwei-shu_perspectiva_tfm.pdf
Size:: 4.69 MB
Format:: Adobe Portable Document Format

Download

Collections

Trabajos Fin de Master (TFM)