Herramienta de anonimización y conversión de voz con Inteligencia Artificial

dc.contributor.advisorGarcía Villalba, Luis Javier
dc.contributor.advisorSandoval Orozco, Ana Lucila
dc.contributor.authorCancio Fernández, Hugo
dc.date.accessioned2025-09-22T17:24:53Z
dc.date.available2025-09-22T17:24:53Z
dc.date.issued2025
dc.degree.titleGrado en Ingeniería de Computadores
dc.descriptionTrabajo de Fin de Grado en Ingeniería de Computadores, Facultad de Informática UCM, Departamento de Ingeniería des Software e Inteligencia Artificial, Curso 2024/2025
dc.description.abstractEste Trabajo contiene el proceso de creación de una herramienta con la función de generar audios con la información privada protegida usado varias técnicas de Inteligencia Artificial. Para el objetivo descrito anteriormente, se llevó a cabo una extensa investigación documentada en este documento que ayudó a profundizar sobre las técnicas usadas como Transcripción de Audio, Reconocimiento de Entidades en Texto y Generación de Audio y los mejores modelos producidos por otros investigadores. Con estos conocimientos se concluyó que una buena estrategia para solucionar el problema sería crear un sistema conformado por varios modelos con las funciones de transcribir el audio a texto, encontrar información personal del texto y censurarla y generar el audio de nuevo con el texto anonimizado y con la posibilidad de cambiar la voz para más privacidad. Para conseguir esto, se probó diversos modelos en cada ámbito comparando su rendimiento para elegir los mejores en cada tarea y se entrenaron otros modelos que dieron mejor eficiencia en cuanto al tiempo de procesado. Por ´ultimo, se unific´o la herramienta final y se cre´o con diversos audios y transcripciones un conjunto de datos nuevo para medir el rendimiento y la eficiencia en anonimizar la información privada de los audios. Los resultados de las pruebas demuestran la generación de audio exitosa con el 86 % de los datos privados censurados, un EER variable según la elección de voz (4 % con la misma voz, 90 % con voz diferente) y valores de MOS próximos a 4 sobre 5 en la calidad del audio.
dc.description.abstractThis document presents the process of creating a tool designed to generate audio outputs with protected private information, employing various techniques from Artificial Intelligence. To achieve this goal, an extensive investigation was conducted and documented in this report, which deepened the understanding of techniques such as Audio Transcription, Text Entity Recognition, and Audio Generation, as well as the leading models developed by other researchers. From this knowledge, it was concluded that an effective strategy to address the problem would be to build a system composed of multiple models with the three different functions. Transcribe the audio into text, identify personal information within the text and censor it and synthesize the audio from the anonymized text, with the option to change the voice for enhanced privacy. To accomplish this, various models with those qualities were tested, comparing their performance to select the best for each task, and additional models were trained to achieve greater processing-time efficiency. Lastly, the complete tool was integrated, and using a variety of audio samples and transcripts, new datasets were created to evaluate the system’s performance and efficiency in anonymizing private information in audio. The results demonstrate successful audio generation with 86 % of private data censored, an optional EER depending on the voice choice (4 % for the same voice, 90 % for a different voice), and MOS values near 4 out of 5 in audio quality.
dc.description.departmentDepto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/124203
dc.language.isospa
dc.page.total59
dc.rights.accessRightsopen access
dc.subject.cdu004(043.3)
dc.subject.keywordAnonimization
dc.subject.keywordAudio Dataset Tool
dc.subject.keywordAudio Information Protection
dc.subject.keywordEntity Recognition Models
dc.subject.keywordGenerative Artificial Inteligence
dc.subject.keywordAnonimización
dc.subject.keywordGeneración de Audio
dc.subject.keywordInteligencia Artificial
dc.subject.keywordNLP
dc.subject.keywordPrivacidad en Audios
dc.subject.keywordReconocimiento de Entidades
dc.subject.keywordRedes neuronales Generativas
dc.subject.ucmInformática (Informática)
dc.subject.unesco33 Ciencias Tecnológicas
dc.titleHerramienta de anonimización y conversión de voz con Inteligencia Artificial
dc.titleVoice anonymization and conversion Tool developement using Artificial Intelligence
dc.typebachelor thesis
dc.type.hasVersionAM
dspace.entity.typePublication
relation.isAdvisorOfPublication0f67f6b3-4d2f-4545-90e1-95b8d9f3e1f0
relation.isAdvisorOfPublicationdea44425-99a5-4fef-b005-52d0713d0e0d
relation.isAdvisorOfPublication.latestForDiscovery0f67f6b3-4d2f-4545-90e1-95b8d9f3e1f0

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Herramienta_de_anonimizacion.pdf
Size:
4.94 MB
Format:
Adobe Portable Document Format