Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Association Rules for predictive purposes applied to omics data

dc.contributor.advisorCalviño Martínez, Aída
dc.contributor.advisorPineda Sanjuan, Silvia
dc.contributor.authorMoreno Ribera, Almudena
dc.date.accessioned2024-10-16T11:24:46Z
dc.date.available2024-10-16T11:24:46Z
dc.date.issued2024-09
dc.descriptionEl adenocarcinoma ductal pancreático (PDAC) es el cáncer más letal a nivel mundial y sin mejoras significativas en el pronóstico en las últimas décadas. La infiltración inmunológica tiene un papel clave en el desarrollo de esta enfermedad. A su vez, la susceptibilidad genética explica el 40% de las diferencias en el sistema inmunológico. El objetivo principal de este estudio es probar la hipótesis de que la susceptibilidad genética podría modular la infiltración inmunológica en los tumores pancreáticos. Los perfiles inmunológicos se clasificaron en tres grupos distintos en función de los niveles de infiltración inmunológica tumoral, mientras que los datos genéticos consistieron en polimorfismos de nucleótido único (SNP, por sus siglas en inglés). Toda la información procedía de un estudio anterior en el que se utilizaron pacientes con cáncer de páncreas de la base de datos TCGA, con un total de 107 pacientes caucásicos y 117.486 SNPs. Este estudio pretende utilizar técnicas estadísticas avanzadas y de Machine Learning para clasificar a los individuos en los tres clústeres basándose en sus datos genotípicos. Se emplearon curvas de supervivencia de Kaplan-Meier y el modelo de riesgos proporcionales de Cox para medir el impacto de pertenecer a cada clúster en la supervivencia de los pacientes. Para la clasificación, se aplicaron modelos de regresión logística multinomial penalizada (Ridge, Lasso y Elastic Net), además de Random Forest y Clasificadores Basados en Reglas de Asociación. El rendimiento de los modelos se evaluó mediante la métrica AUC pairwise. Los mejores resultados fueron obtenidos por el Random Forest y las Reglas de Asociación. El establecimiento de un vínculo entre la infiltración inmunitaria y la susceptibilidad genética podría ofrecer nuevas perspectivas en la investigación del cáncer de páncreas.
dc.description.abstractPancreatic ductal adenocarcinoma (PDAC) is the most lethal cancer globally, with limited improvements in prognosis over the past few decades. Immune infiltration plays a critical role in the progression of this disease, while genetic susceptibility is known to account for approximately 40% of the variability in immune system function. The primary objective of this study is to test the hypothesis that genetic susceptibility may modulate immune infiltration in pancreatic tumors. Immune profiles were categorized into three distinct clusters based on levels of tumor immune infiltration while genetic data, consisted of Single Nucleotide Polymorphisms (SNPs). All the information was derived from a previous study using pancreatic cancer patients from the TCGA database, with a total of 107 Caucasian patients and 117,486 SNPs. This study aims to utilize advanced statistical and Machine Learning techniques to classify individuals into the three clusters based on their genotypic data. Kaplan-Meier survival curves and the Cox proportional hazards model were employed to measure the impact of immune clusters on patient survival. For classification, penalized multinomial logistic regression models (Ridge, Lasso, and Elastic Net), alongside Random Forest and Association Rule-based classifiers, were applied. Model performance was assessed using the pairwise AUC metric, with Random Forest and Association Rule-based models yielding the best results. Establishing a link between immune infiltration and genetic susceptibility could offer new insights into pancreatic cancer research.
dc.description.departmentDepto. de Estadística y Ciencia de los Datos
dc.description.facultyFac. de Estudios Estadísticos
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/109010
dc.language.isoeng
dc.master.titleMáster en Bioestadística
dc.page.total55
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu616.37
dc.subject.cdu519.22-76
dc.subject.cdu57.087.1
dc.subject.keywordhigh-dimensional data
dc.subject.keywordImmunoglobulin Kappa (IGK)
dc.subject.keywordSingle Nucleotide Polymorphisms (SNPs)
dc.subject.keywordpancreatic cancer
dc.subject.keywordMachine Learning
dc.subject.keywordAssociation Rules
dc.subject.keyworddatos de alta dimensionalidad
dc.subject.keywordinmunoglobulina kappa (IGK)
dc.subject.keywordpolimorfismos de nucleótido único (SNPs)
dc.subject.keywordcáncer de páncreas
dc.subject.keywordaprendizaje automático
dc.subject.keywordreglas de asociación
dc.subject.ucmTécnicas de Investigación Social
dc.subject.ucmOncología
dc.subject.ucmEstadística aplicada
dc.subject.unesco1209.12 Técnicas de Asociación Estadística
dc.subject.unesco3201.01 Oncología
dc.titleAssociation Rules for predictive purposes applied to omics data
dc.typemaster thesis
dc.type.hasVersionAO
dspace.entity.typePublication
relation.isAdvisorOfPublication9910901c-7e34-482c-b57c-470f4e445cfb
relation.isAdvisorOfPublication9ff02bb9-3623-452e-ad72-8bb19687ec4e
relation.isAdvisorOfPublication.latestForDiscovery9910901c-7e34-482c-b57c-470f4e445cfb

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TFM - Moreno Ribera, Almudena.pdf
Size:
1.34 MB
Format:
Adobe Portable Document Format