Herramienta de anonimización y conversión de voz con Inteligencia Artificial

Cancio Fernández, Hugo

Herramienta de anonimización y conversión de voz con Inteligencia Artificial

dc.contributor.advisor	García Villalba, Luis Javier
dc.contributor.advisor	Sandoval Orozco, Ana Lucila
dc.contributor.author	Cancio Fernández, Hugo
dc.date.accessioned	2025-09-22T17:24:53Z
dc.date.available	2025-09-22T17:24:53Z
dc.date.issued	2025
dc.degree.title	Grado en Ingeniería de Computadores
dc.description	Trabajo de Fin de Grado en Ingeniería de Computadores, Facultad de Informática UCM, Departamento de Ingeniería des Software e Inteligencia Artificial, Curso 2024/2025
dc.description.abstract	Este Trabajo contiene el proceso de creación de una herramienta con la función de generar audios con la información privada protegida usado varias técnicas de Inteligencia Artificial. Para el objetivo descrito anteriormente, se llevó a cabo una extensa investigación documentada en este documento que ayudó a profundizar sobre las técnicas usadas como Transcripción de Audio, Reconocimiento de Entidades en Texto y Generación de Audio y los mejores modelos producidos por otros investigadores. Con estos conocimientos se concluyó que una buena estrategia para solucionar el problema sería crear un sistema conformado por varios modelos con las funciones de transcribir el audio a texto, encontrar información personal del texto y censurarla y generar el audio de nuevo con el texto anonimizado y con la posibilidad de cambiar la voz para más privacidad. Para conseguir esto, se probó diversos modelos en cada ámbito comparando su rendimiento para elegir los mejores en cada tarea y se entrenaron otros modelos que dieron mejor eficiencia en cuanto al tiempo de procesado. Por ´ultimo, se unific´o la herramienta final y se cre´o con diversos audios y transcripciones un conjunto de datos nuevo para medir el rendimiento y la eficiencia en anonimizar la información privada de los audios. Los resultados de las pruebas demuestran la generación de audio exitosa con el 86 % de los datos privados censurados, un EER variable según la elección de voz (4 % con la misma voz, 90 % con voz diferente) y valores de MOS próximos a 4 sobre 5 en la calidad del audio.
dc.description.abstract	This document presents the process of creating a tool designed to generate audio outputs with protected private information, employing various techniques from Artificial Intelligence. To achieve this goal, an extensive investigation was conducted and documented in this report, which deepened the understanding of techniques such as Audio Transcription, Text Entity Recognition, and Audio Generation, as well as the leading models developed by other researchers. From this knowledge, it was concluded that an effective strategy to address the problem would be to build a system composed of multiple models with the three different functions. Transcribe the audio into text, identify personal information within the text and censor it and synthesize the audio from the anonymized text, with the option to change the voice for enhanced privacy. To accomplish this, various models with those qualities were tested, comparing their performance to select the best for each task, and additional models were trained to achieve greater processing-time efficiency. Lastly, the complete tool was integrated, and using a variety of audio samples and transcripts, new datasets were created to evaluate the system’s performance and efficiency in anonymizing private information in audio. The results demonstrate successful audio generation with 86 % of private data censored, an optional EER depending on the voice choice (4 % for the same voice, 90 % for a different voice), and MOS values near 4 out of 5 in audio quality.
dc.description.department	Depto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.faculty	Fac. de Informática
dc.description.refereed	TRUE
dc.description.status	unpub
dc.identifier.uri	https://hdl.handle.net/20.500.14352/124203
dc.language.iso	spa
dc.page.total	59
dc.rights.accessRights	open access
dc.subject.cdu	004(043.3)
dc.subject.keyword	Anonimization
dc.subject.keyword	Audio Dataset Tool
dc.subject.keyword	Audio Information Protection
dc.subject.keyword	Entity Recognition Models
dc.subject.keyword	Generative Artificial Inteligence
dc.subject.keyword	Anonimización
dc.subject.keyword	Generación de Audio
dc.subject.keyword	Inteligencia Artificial
dc.subject.keyword	NLP
dc.subject.keyword	Privacidad en Audios
dc.subject.keyword	Reconocimiento de Entidades
dc.subject.keyword	Redes neuronales Generativas
dc.subject.ucm	Informática (Informática)
dc.subject.unesco	33 Ciencias Tecnológicas
dc.title	Herramienta de anonimización y conversión de voz con Inteligencia Artificial
dc.title	Voice anonymization and conversion Tool developement using Artificial Intelligence
dc.type	bachelor thesis
dc.type.hasVersion	AM
dspace.entity.type	Publication
relation.isAdvisorOfPublication	0f67f6b3-4d2f-4545-90e1-95b8d9f3e1f0
relation.isAdvisorOfPublication	dea44425-99a5-4fef-b005-52d0713d0e0d
relation.isAdvisorOfPublication.latestForDiscovery	0f67f6b3-4d2f-4545-90e1-95b8d9f3e1f0

Download

Original bundle

Now showing 1 - 1 of 1

Name:: Herramienta_de_anonimizacion.pdf
Size:: 4.94 MB
Format:: Adobe Portable Document Format

(Restricted until: 2026-09-01) Download

Collections

Trabajos Fin de Grado (TFG) y Diplomas de Estudios Avanzados (DEA)