Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Implementación de una API para el análisis de la voz en tiempo real enfocado a Entornos de Realidad Virtual

dc.contributor.advisorRomero Hernández, Alejandro
dc.contributor.advisorManero Iglesias, José Borja
dc.contributor.authorMartín Gómez, Daniel
dc.date.accessioned2024-11-18T16:16:47Z
dc.date.available2024-11-18T16:16:47Z
dc.date.issued2024
dc.degree.titleGrado en Desarrollo de Videojuegos
dc.descriptionThis project involves the development of an API that allows sending real-time audio to the 'HumeAI' library. This Python library enables the sending of phrases, URLs, images, and audio (which is the focus of this work) and performs emotional analysis of up to 51 different emotions from the submitted elements. Subsequently, the data is received and analyzed with another Python library for the Praat software, called 'Parselmouth.' This allows the detection of various audio characteristics using vocal patterns such as voice pitch, rhythm, and intensity in real time. This API allows a user to send data for processing, in this case, voice, to a server, communicate with the API, and return the vocal analysis to the user so they can manage the vocal values and emotions as required in their application. Additionally, another library called 'Flask' is used, whose purpose is to create a server that enables HTTP requests between the API and the application from which it is called, such as a 'Unity' project.
dc.description.abstractEste proyecto consiste en el desarrollo de una API que permite mandar audios en tiempo real que son enviados a la biblioteca HumeAI. Esta librería de python permite el envío de frases, urls, imágenes y audios (en los que se centra este trabajo) y realiza el análisis emocional de hasta 51 emociones diferentes de dichos elementos enviados. Posteriormente, se reciben los datos y se analizan con otra librería de Phyton para el software Praat, llamada Parselmouth. Esta permite la detección de diversas características del audio utilizando patrones vocales como el tono de voz, ritmo e intensidad en tiempo real. Esta API permite que un usuario mande los datos a procesar, en este caso la voz, a un servidor, comunicarse con la API en cuestión y devolver el análisis vocal al usuario para que gestione dichos valores vocales y emociones como sean requeridos en su aplicación. Además, se utiliza otra librería llamada Flask cuyo propósito es crear un servidor que permita comunicar las peticiones HTTP entre la API y la aplicación desde la cual se llame, como pudiese ser un proyecto de Unity.
dc.description.departmentDepto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/110732
dc.language.isospa
dc.page.total122
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu004(043.3)
dc.subject.keywordHumeAI
dc.subject.keywordParselmouth
dc.subject.keywordFlask
dc.subject.keywordEmociones
dc.subject.keywordRitmo
dc.subject.keywordIntensidad
dc.subject.keywordTono
dc.subject.keywordVoz
dc.subject.keywordAPI
dc.subject.keywordEmotions
dc.subject.keywordRhythm
dc.subject.keywordIntensity
dc.subject.keywordTone
dc.subject.keywordVoice
dc.subject.ucmInformática (Informática)
dc.subject.unesco33 Ciencias Tecnológicas
dc.titleImplementación de una API para el análisis de la voz en tiempo real enfocado a Entornos de Realidad Virtual
dc.title.alternativeImplementation of an API for real-time voice analysis focused on Virtual Reality Environments
dc.typebachelor thesis
dc.type.hasVersionAM
dspace.entity.typePublication
relation.isAdvisorOfPublication32828fad-26cb-4919-a993-8cb836db4ad4
relation.isAdvisorOfPublication0e709211-9a4b-47f4-90a8-0397add3b32a
relation.isAdvisorOfPublication.latestForDiscovery32828fad-26cb-4919-a993-8cb836db4ad4

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
IMPLEMENTACION_DE_UNA_API_PARA_EL_ANALISIS_DE_LA_VOZ.pdf
Size:
7.04 MB
Format:
Adobe Portable Document Format