Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Herramienta para la identificación de personas mediante el uso de redes neuronales convolucionales

dc.contributor.advisorGarcía Villalba, Luis Javier
dc.contributor.advisorMartínez Hernández, Luis Alberto
dc.contributor.authorCanive Huguet, Oscar
dc.date.accessioned2024-11-06T15:38:33Z
dc.date.available2024-11-06T15:38:33Z
dc.date.issued2024
dc.degree.titleGrado en Ingeniería Informática
dc.descriptionTrabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2023/2024
dc.description.abstractEste proyecto explora el desarrollo de un modelo de red neuronal capaz de reconocer individuos basándose en su voz en grabaciones de audio. El objetivo es mejorar los sistemas de reconocimiento de personas enfocándose únicamente en el audio, aprovechando técnicas avanzadas de aprendizaje profundo y redes neuronales convolucionales (CNN) preentrenadas. A lo largo del proyecto, se exploraron diversos enfoques, incluyendo el uso de espectrogramas de Mel y MFCCs para convertir las se˜nales de audio en datos visuales que pudieran ser procesados eficazmente por las CNNs. El uso de redes preentrenadas, como VGG16, aceleró significativamente el proceso de desarrollo y mejoró la precisión del modelo. El proyecto también implicó una extensa experimentación con configuraciones de red y ajuste de hiperparámetros para optimizar el rendimiento. Los resultados destacan el potencial de las redes neuronales en tareas de identificación basadas en audio, ofreciendo valiosos conocimientos para futuros avances en el campo del reconocimiento de hablantes y el análisis forense.
dc.description.abstractThis project explores the development of a neural network model capable of recognizing individuals based on their voice in audio recordings. The aim is to enhance person recognition systems by focusing solely on audio, leveraging advanced deep learning techniques and pretrained convolutional neural networks (CNNs). Throughout the project, various approaches were explored, including the use of Mel spectrograms and MFCCs to convert audio signals into visual data that could be effectively processed by CNNs. The use of pretrained networks, such as VGG16, significantly accelerated the development process and improved the model’s accuracy. The project also involved extensive experimentation with network configurations and hyperparameter tuning to optimize performance. The results highlight the potential of neural networks in audio-based identification tasks, offering valuable insights for future advancements in the field of speaker recognition and forensic analysis.
dc.description.departmentDepto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/110115
dc.language.isospa
dc.page.total70
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu004(043.3)
dc.subject.keywordCNN
dc.subject.keywordMFCC
dc.subject.keywordVGG16
dc.subject.keywordAudio
dc.subject.keywordPeople recognition
dc.subject.keywordAISHELL
dc.subject.keywordKeras
dc.subject.keywordNeural Networks
dc.subject.keywordPre-trained nets
dc.subject.keywordEspectrogram
dc.subject.keywordMel
dc.subject.keywordReconocimiento de personas
dc.subject.keywordRedes neuronales
dc.subject.keywordRedes pre-entrenadas
dc.subject.keywordEspectogramas
dc.subject.ucmInformática (Informática)
dc.subject.unesco33 Ciencias Tecnológicas
dc.titleHerramienta para la identificación de personas mediante el uso de redes neuronales convolucionales
dc.title.alternativeTool for the identification of persons by using convolutional neural networks
dc.typebachelor thesis
dc.type.hasVersionAM
dspace.entity.typePublication
relation.isAdvisorOfPublication0f67f6b3-4d2f-4545-90e1-95b8d9f3e1f0
relation.isAdvisorOfPublication.latestForDiscovery0f67f6b3-4d2f-4545-90e1-95b8d9f3e1f0

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Herramienta_para_la_identificacion_de_personas.pdf
Size:
2.25 MB
Format:
Adobe Portable Document Format