Aprendizaje de representaciones latentes de timbres musicales con autocodificadores y autocodificadores variacionales

García López, Pablo

Aprendizaje de representaciones latentes de timbres musicales con autocodificadores y autocodificadores variacionales

dc.contributor.advisor	Palomino Tarjuelo, Miguel
dc.contributor.advisor	Sánchez Hernández, Jaime
dc.contributor.author	García López, Pablo
dc.date.accessioned	2025-09-15T16:16:40Z
dc.date.available	2025-09-15T16:16:40Z
dc.date.issued	2025
dc.degree.title	Grado en Ingeniería Informática
dc.description	Trabajo de Fin de Grado en Ingeniería Informática, Facultad Informática UCM, Dpto. de Sistemas Informáticos y Computación. Curso 2024/2025.
dc.description.abstract	En este trabajo de fin de grado se aplica el aprendizaje profundo a la reconstrucción y generación de audio musical, considerando dos arquitecturas: autocodificadores (AEs) y autocodificadores variacionales (VAEs). A diferencia de la generación simbólica de música, que opera sobre formatos de más alto nivel como MIDI, adoptamos un enfoque musical no simbólico y trabajamos directamente sobre representaciones de más bajo nivel como son las muestras de audio y sus correspondientes representaciones frecuenciales. Tras una revisión de la historia de la composición algorítmica y de varios métodos de síntesis de audio, se utilizan autocodificadores convolucionales para comprimir y reconstruir notas musicales, y autocodificadores variacionales para sintetizar audio mediante el muestreo dentro de representaciones ocultas aprendidas. A lo largo del proyecto, se investigan diversas configuraciones y arquitecturas de modelos con el objetivo de mejorar la calidad de reconstrucción y generación de audio.
dc.description.abstract	In this Bacherlor’s Thesis, deep learning is applied to musical audio reconstruction and generation, considering two architectures: autoencoders (AEs) and variational autoencoders (VAEs). Unlike symbolic music generation, which operates on higher-level formats such as MIDI, we adopt a non-symbolic approach and work directly with lower-level data such as raw audio samples and their corresponding frequency-domain transformations. Following an overview of the history of algorithmic composition and several methods of audio synthesis, convolutional autoencoders are used to compress and reconstruct musical notes, and variational autoencoders to synthesize audio by sampling within learned hidden representations. Throughout the project, various model settings and architectures are investigated in an attempt of enhancing reconstruction quality and generation performance.
dc.description.department	Depto. de Sistemas Informáticos y Computación
dc.description.faculty	Fac. de Informática
dc.description.refereed	TRUE
dc.description.status	unpub
dc.identifier.uri	https://hdl.handle.net/20.500.14352/123949
dc.language.iso	eng
dc.page.total	70
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	en
dc.rights.accessRights	open access
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu	004(043.3)
dc.subject.keyword	Aprendizaje profundo
dc.subject.keyword	Autocodificadores
dc.subject.keyword	Autocodificadores variacionales
dc.subject.keyword	Espacio latente
dc.subject.keyword	Espectrograma
dc.subject.keyword	Red convolucional
dc.subject.keyword	Deep Learning
dc.subject.keyword	Autoencoders
dc.subject.keyword	Variational Autoencoders
dc.subject.keyword	Latent space
dc.subject.keyword	Spectro- gram
dc.subject.keyword	Convolutional network
dc.subject.ucm	Informática (Informática)
dc.subject.unesco	33 Ciencias Tecnológicas
dc.title	Aprendizaje de representaciones latentes de timbres musicales con autocodificadores y autocodificadores variacionales
dc.title	Learning latent representations of timbre using autoencoders and variational autoencoders
dc.type	bachelor thesis
dc.type.hasVersion	AM
dspace.entity.type	Publication
relation.isAdvisorOfPublication	52909b00-b705-4307-84db-d3211eedef69
relation.isAdvisorOfPublication	f0eee9a9-5f99-4e32-8f7e-db6418a011bc
relation.isAdvisorOfPublication.latestForDiscovery	52909b00-b705-4307-84db-d3211eedef69

Download

Original bundle

Now showing 1 - 1 of 1

Name:: Aprendizaje_representaciones_latentes.pdf
Size:: 9.53 MB
Format:: Adobe Portable Document Format

Download

Collections

Trabajos Fin de Grado (TFG) y Diplomas de Estudios Avanzados (DEA)