Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Elaboración de informes automatizados sobre datos históricos: la liga española de futbol

Loading...
Thumbnail Image

Official URL

Full text at PDC

Publication date

2024

Advisors (or tutors)

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations
Google Scholar

Citation

Abstract

La elaboración de informes históricos sobre un tema en el periodismo demanda un enorme esfuerzo. En primer lugar, se invierte mucho tiempo consultando fuentes de diversa índole, como noticias, informes y otros documentos que, además, suelen encontrarse en distintas localizaciones, ej. bases de datos o páginas web, y con distintas estructuras, ej. texto y tablas. Tras recabar toda esa información, hay que filtrarla para extraer la más relevante para cada caso concreto. Después, hay que procesarla y elaborarla para generar los formatos y el texto requeridos, mejorar su legibilidad y extraer y destacar la información más importante. El presente Trabajo de Fin de Grado (TFG) tiene como objetivo simplificar la elaboración de estos informes usando los desarrollos recientes en Inteligencia Artificial Generativa (IAG), una subcategoría dentro de la inteligencia Artificial (IA) capaz de generar texto, imágenes y, en definitiva, contenido nuevo, a partir de modelos de aprendizaje profundo entrenados con la suficiente cantidad de datos de calidad. En el contexto de la generación de informes, la IAG está emergiendo como una herramienta muy valiosa para optimizar el flujo de trabajo y proporcionar análisis más detallados. Los profesionales ahora pueden aprovechar estas capacidades para centrarse en otras tareas mientras la IA se encarga del procesamiento y síntesis de información. Este trabajo prueba la aproximación con IAG mediante la creación de una aplicación para la generación de informes deportivos. La aplicación extrae información web utilizando web scraping, almacena parte de ella en una base de datos y usa una IAG para elaborar los informes conforme a ciertas pautas (algunas que están embebidas en la aplicación y otras proporcionadas por el usuario). Además, se incluye una interfaz web de usuario para facilitar la interacción con el sistema, fundamentalmente especificar los informes a generar y los datos relevantes sobre ellos y examinar los resultados. El dominio elegido para los informes es la liga española de fútbol. Los informes que se pueden generar son relativos a un partido, jornada o temporada, y el resultado es un informe textual sobre los datos seleccionados a partir de los datos disponibles en las fuentes web que usa la aplicación.
Historical reporting in journalism requires a lot of effort. First, a lot of time is spent consulting sources of various kinds, such as, news, reports and other documents, which are often found in different locations, e.g. databases or websites, and with different structures, e.g. text and tables. Once all this information has been gathered, it needs to be filtered to extract the most relevant information for each specific case. It then needs to be processed and edited to generate the required formats, improve its readability and extract the most relevant information. The aim of this Final Degree Project (Spanish acronym TFG) is to facilitate the production of these reports using the latest developments in Generative Artificial Intelligence (Generative AI or GAI), a subcategory of AI capable of generating text, images and, in short, new content from deep learning models trained with sufficient amount of quality data. In recent years, we have seen a significant growth in the application of GAI in various domains. In the context of reporting, GAI is proving to be a valuable tool for workflow optimization and more detailed analysis. Users can now use these capabilities to focus on other tasks, while AI takes care of information processing and synthesis. This paper tests this approach with GAI by creating an application for generating sports reports. The application extracts web information using web scraping, stores part of it in a database and uses GAI to produce the reports according to certain guidelines (some hard-coded as parts of the application and others provided by the user). In addition, a web user interface is included to facilitate the interaction with the system, essentially specifying the reports to be generated and the relevant data about them and examining the results. The chosen domain for the reports is the Spanish football league. The reports that can be generated are related to a match, a game week, or a season, and the result is a textual report on the selected data based on the information available from the web sources used by the application.

Research Projects

Organizational Units

Journal Issue

Description

Trabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2023/2024.

Keywords