Evaluación de técnicas de validación interna en modelos predictivos en genómica

dc.contributor.advisorPeressini Álvare, Melina
dc.contributor.advisorPineda Sanjuan, Silvia
dc.contributor.authorMedrano Buendía, Elisa
dc.date.accessioned2025-07-28T12:07:31Z
dc.date.available2025-07-28T12:07:31Z
dc.date.issued2025-07
dc.description.abstractLa modelización con datos transcriptómicos presenta diversos retos, entre ellos la alta dimen sionalidad y el reducido tamaño muestral de los conjuntos de datos. Este trabajo tiene por objetivo comparar dos técnicas de validación interna ampliamente utilizadas: la validación cruzada repetida (repcv) y el optimismo corregido por bootstrap (optboot), para evaluar su desempeño en la estimación del rendimiento de un modelo de regresión logística penalizada con Lasso en este escenario. Se lleva a cabo un estudio de simulación con datos sintéticos para buscar diferencias en el ajuste de hiperparámetros, la selección de predictores y el rendimiento de los modelos. Los resultados indican que repcv proporciona modelos más simples con mejor rendimiento real y, además, menor sesgo en la estimación del rendimiento. Se puede concluir que, a diferencia de resultados previos en escenarios de baja dimensionalidad, repcv ofrece estimaciones más fiables en escenarios p " n. Con este trabajo se quiere mostrar la importancia de ajustar las técnicas de validación al escenario que se esté estudiando.
dc.description.abstractModelling using transcriptomic data poses various challenges, such as high dimensionality scenarios and a reduced sample sizes. The goal of this project is to compare two widely known validation techniques: repeated k-fold cross validation (repcv) and optimism corrected bootstrap (optboot), in order to evaluate their performance in estimating the predictive ability of a logistic regression model penalized by Lasso. A simulation study will be conducted using synthetic data to search for differ ences in hyperparameter tuning, predictors selection and model performance. Results show that repcv yields simpler models with better real performance and less biased performance estimates. We conclude that, contrary to previous findings in low dimensionality settings, repcv provides more reliable estimations in p " n scenarios. With this projects, we aim to remark the importance of adapting the validation techniques to the specific characteristics of the problem at hand.
dc.description.departmentDepto. de Estadística y Ciencia de los Datos
dc.description.facultyFac. de Estudios Estadísticos
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/122792
dc.language.isospa
dc.master.titleMáster en Bioestadística
dc.page.total83
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsmetadata only access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu575.113
dc.subject.cdu519.2
dc.subject.keywordAlta dimensionalidad
dc.subject.keywordLasso
dc.subject.keywordValidación interna
dc.subject.keywordOptimismo corregido mediante bootstrap
dc.subject.keywordValidación cruzada repetida
dc.subject.keywordHigh dimensionality
dc.subject.keywordInternal validation
dc.subject.keywordOptimism corrected bootstrap
dc.subject.keywordRepeated k-fold cross validation
dc.subject.ucmLógica simbólica y matemática (Filosofía)
dc.subject.ucmLógica simbólica y matemática (Filosofía)
dc.subject.ucmGenética
dc.subject.unesco11 Lógica
dc.subject.unesco1209.14 Técnicas de Predicción Estadística
dc.subject.unesco2409 Genética
dc.titleEvaluación de técnicas de validación interna en modelos predictivos en genómica
dc.typemaster thesis
dc.type.hasVersionAO
dspace.entity.typePublication
relation.isAdvisorOfPublication9ff02bb9-3623-452e-ad72-8bb19687ec4e
relation.isAdvisorOfPublication.latestForDiscovery9ff02bb9-3623-452e-ad72-8bb19687ec4e

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
MEDRANO_BUENDIA_TFM_MBE.pdf
Size:
1.77 MB
Format:
Adobe Portable Document Format