Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Perspectiva del DoubleDQN en los sistemas de recomendación para resolver el problema de item cold-start

dc.contributor.advisorCarrasco González, Ramón Alberto
dc.contributor.authorShu, Ziwei
dc.date.accessioned2023-06-17T10:17:57Z
dc.date.available2023-06-17T10:17:57Z
dc.date.defense2021
dc.date.issued2021
dc.description.abstractLos sistemas de recomendación se utilizan ampliamente en nuestra vida. Por ejemplo, se recomiendan unos productos que le pueden interesar a partir de su historial de compra o visitas (Amazon); unas películas que le puedan gustar según su popularidad (Netflix), etc. De hecho, esos no solo ayudan a los consumidores a encontrar productos que les puedan interesar, sino que también permiten a las empresas a atraer y retener a más clientes. Muchas empresas aplican el filtrado colaborativo en sus sistemas de recomendación para proporcionar una lista de elementos potenciales a cada usuario. No obstante, la mayoría de los modelos del filtrado colaborativo no tienen en cuenta los cambios dinámicos de las preferencias de los usuarios y hacen recomendaciones siguiendo una estrategia estática. Otro problema grave del filtrado colaborativo es el arranque en frío (cold-start, en inglés), que ocurre cuando el sistema de recomendación no ha sido capaz de detectar los productos similares debido a la falta de la información de los comportamientos de usuarios o la calificación de productos. En consecuencia, el objetivo de este trabajo es diseñar un novedoso algoritmo de recomendación basado ene l aprendizaje por refuerzo (Reinforcement Learning, en inglés), que favorece encontrar automáticamente la estrategia óptima de recomendación mediante las interacciones continuas con los usuarios. Al mismo tiempo, verificaría si éste tuviera capacidad de resolver el problema de item cold-start y el efecto temporal de las recomendaciones. Se han usado 2 conjuntos de datos de MovieLens, uno de 610 usuarios que puntuaron 9724 películas en la plataforma MovieLens entre el 29 de marzo de 996 y el 24 de septiembre de 2018 (MovieLensSLD), y el otro de 943 usuarios que puntuaron 1682 películas antes del año 1999 (MOvieLens 100K). Se han depurado los datos a través de SAS Miner, y posteriormente los analizaron con Python mediante los algoritmos clásicos de sistemas de recomendación, el algoritmo Deep Q Network (en adelante DQN) y Double Deep Q-Network (en adelante DoubleDQN) con el fin de comparar sus rendimientos en cada conjunto de dato.
dc.description.departmentUnidad Docente de Organización de Empresas y Marketing
dc.description.facultyFac. de Estudios Estadísticos
dc.description.refereedFALSE
dc.description.statussubmitted
dc.eprint.idhttps://eprints.ucm.es/id/eprint/66311
dc.identifier.urihttps://hdl.handle.net/20.500.14352/9198
dc.language.isospa
dc.master.titleMáster en Minería de Datos e Inteligencia de Negocios
dc.rightsAtribución 3.0 España
dc.rights.accessRightsopen access
dc.rights.urihttps://creativecommons.org/licenses/by/3.0/es/
dc.subject.cdu004.738.52:338.46
dc.subject.keywordAlgoritmos
dc.subject.keywordSistemas de recomendación (Informática)
dc.subject.keywordReinforcement learning
dc.subject.keywordDeep Q-Network
dc.subject.keywordDouble Deep Q-Network
dc.subject.keywordRecommender systems (Information filtering)
dc.subject.ucmEstadística
dc.subject.ucmInvestigación Comercial
dc.subject.unesco1209 Estadística
dc.titlePerspectiva del DoubleDQN en los sistemas de recomendación para resolver el problema de item cold-start
dc.typemaster thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication658b3e73-df89-4013-b006-45ea9db05e25
relation.isAdvisorOfPublication.latestForDiscovery658b3e73-df89-4013-b006-45ea9db05e25

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
zwei-shu_perspectiva_tfm.pdf
Size:
4.69 MB
Format:
Adobe Portable Document Format