Estadística multivariante aplicada al análisis y predicción de partidos de fútbol en las principales ligas europeas

El propósito de este estudio es analizar las estadísticas de juego en las principales ligas europeas y ver qué factores son más determinantes a la hora de predecir el resultado de un partido. Para ello usaremos técnicas de estadística multivariante incluyendo análisis de componentes principales y regresión logística. Las dos primeras componentes principales explican alrededor del 70 % de precisión obtenida cuando se predicen victorias fuera de casa tomando como variables predictivas las propias componentes. Este estudio también demuestra que en la liga inglesa los partidos son menos equilibrados.
The purpose of this study is to analyse main game-related statistics differences between the main European leagues and which factors are more determinant when predicting a match score, by means of multivariate statistical techniques, including principal component analysis and logistic regression. The first two principal components explain around the 70 % of variance, and over a 70 % of accuracy is obtained when predicting away-team wins, with these two principal components as predictive variables. This study also shows that in English Premier League, games are less equilibrated.
