%0 Journal Article %A Constante-Amores, Alexander %A Arroyo Resino, Gema Delia %A Sánchez Munilla, María %A Asensio Muñoz, Isabel Inmaculada %T Contribución del machine learning al análisis de la repetición escolar en España: un estudio con datos PISA %T Contribution of machine learning to the analysis of grade repetition in Spain: a study based on PISA data %D 2024 %@ 0034-9461 %U https://hdl.handle.net/20.500.14352/114006 %X La repetición de curso tiene una excesiva incidencia en España a pesar de ser una medida controvertida. A fin de obtener evidencias que contribuyan a su reducción en la educación obligatoria, el presente trabajo profundiza en el estudio de los índices de contexto de PISA 2018 más vinculados con dicho fenómeno. Con la muestra de estudiantes españoles (n = 35943), se utiliza un método de aprendizaje automático para seleccionar y ordenar los predictores, y una regresión logística multinivel (estudiantes y centros) para cuantificar la contribución de cada uno. Se obtienen las 30 variables de contexto más relevantes en cada etapa educativa, que explican el 65.5% de la varianza de la repetición en primaria y casi el 55.7% en secundaria. Los principales indicadores son sobre todo del nivel de estudiantes, lo que sugiere la idoneidad de intervenciones psicoeducativas basadas en el apoyo individualizado más que en políticas generalizadas. De ahí emergen medidas potencialmente más eficientes y equitativas que la repetición, centradas, por ejemplo, en la gestión del tiempo de aprendizaje o en la orientación académico-profesional, así como predictores con importancia específica diferencial en cada etapa. En el ámbito metodológico, el estudio hace una aportación a la mejora de la especificación de los modelos predictivos. %X The rate of grade repetition is excessively high in Spain despite being a controversial measure. In order to obtain evidence to contribute to reducing it in compulsory education, the present work is an in-depth study of the PISA 2018 context indices that are most closely linked to this phenomenon. With the sample of Spanish students (n = 35 943), we used an automatic machine learning method to select and order the predictors, and multilevel logistic regression (students and centres) to quantify the contribution of each one. For each educational stage we obtained the 30 most significant contextual variables, which explain 65.5% of the grade repetition variance in primary education and almost 55.7% in secondary education. The main indicators are principally at student level, which suggests the suitability of psychoeducational interventions based more on individual support than general policies. This gives rise to potentially more efficient and equitable measures than grade repetition, aimed at, for example, the management of learning time or academic/professional guidance, and predictors with specific differential significance at each stage. Methodologically, the study contributes to improving the specification of predictive models. %~