RT Generic T1 Generación de resúmenes de video-entrevistas utilizando redes neuronales T2 Generation of video-interview summaries using neural networks A1 Lozano Hernández, Francisco Javier A1 Alcázar Muñoz, Daniel AB El Alzheimer es una enfermedad neurodegenerativa que produce deterioro cognitivo, pérdida de memoria, así como problemas con el pensamiento y el comportamiento. Actualmente, existen terapias que tienen como objetivo mejorar la calidad de vida de las personas que padecen esta enfermedad.Una de estas terapias es la historia de vida, una técnica narrativa en la que el paciente cuenta su vida al terapeuta en diferentes sesiones en un formato de entrevista semi-estructurada.Aprovechando las nuevas tecnologías es posible grabar en vídeo las diferentes sesiones de las historias de vida para después procesarlas y así servir de ayuda a los terapeutas que tratan a estas personas. Un paso más allá de esta idea, se encuentra el proyecto CANTOR. Este proyecto propone el desarrollo de una herramienta digital integrada capaz de utilizar tecnologías de inteligencia artificial, realizando un apoyo a la terapia ocupacional.De esta forma, este trabajo se centra en la investigación y la creación de un aplicación web capaz de obtener la transcripción de las video-entrevistas y generar el resumen en español utilizando redes neuronales. Para la transcripción, además de la biblioteca SpeechRecognition para separar el audio por silencios, se utiliza la API de SpeechToText de Google para identificar y separar los hablantes. Para la generación de resúmenes usamos un modeloBETO pre-entrenado en resúmenes de noticias cuya implementación se hace utilizando la biblioteca de Hugging Face Transformers. Se expone la experimentación y conclusiones tanto de las diferentes maneras en las que se transcribe un vídeo como de las diferentes formas de pre-procesar la transcripción para generar el resumen. AB Alzheimer’s is a neurodegenerative disease that causes cognitive impairment, memory loss, as well as problems with thinking and behaviour. Currently, there are therapies that aim to improve the quality of life of people suffering from this disease. One of these therapies is life story, a narrative technique in which the patient tells the therapist about his or her life in different sessions in a semi-structured interview format.Taking advantage of new technologies, it is possible to video-record the different sessions of the life stories and then process them to help the therapists who treat these people. One step beyond this idea is the CANTOR project. This project proposes the development of an integrated digital tool capable of using Artificial Intelligence technologies to support occupational therapy.In this way, this work focuses on the research and creation of a web application capable of obtaining the transcription of the video-interviews and generating the summary in Spanish using neural networks. For the transcription,in addition to the SpeechRecognition library to separate by silences, the Google SpeechToText API is used to separate by speakers. The BETO model pre-trained on news summaries and implemented thanks to the Hugging Face Transformers library generates the summaries. Experimentation and conclusions are presented both on the different ways in which a video is transcribed and on the different ways of pre-processing the transcript to generate the summary. YR 2021 FD 2021-09-21 LK https://hdl.handle.net/20.500.14352/5354 UL https://hdl.handle.net/20.500.14352/5354 LA spa NO Trabajo de Fin de Grado en Ingeniería de Software, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2020-2021, El código fuente referente a este proyecto se encuentra alojado en:https://github.com/NILGroup/TFG2021RecuerdosVideo DS Docta Complutense RD 6 oct 2024