Aprendizaje de representaciones latentes de timbres musicales con autocodificadores y autocodificadores variacionales

dc.contributor.advisorPalomino Tarjuelo, Miguel
dc.contributor.advisorSánchez Hernández, Jaime
dc.contributor.authorGarcía López, Pablo
dc.date.accessioned2025-09-15T16:16:40Z
dc.date.available2025-09-15T16:16:40Z
dc.date.issued2025
dc.degree.titleGrado en Ingeniería Informática
dc.descriptionTrabajo de Fin de Grado en Ingeniería Informática, Facultad Informática UCM, Dpto. de Sistemas Informáticos y Computación. Curso 2024/2025.
dc.description.abstractEn este trabajo de fin de grado se aplica el aprendizaje profundo a la reconstrucción y generación de audio musical, considerando dos arquitecturas: autocodificadores (AEs) y autocodificadores variacionales (VAEs). A diferencia de la generación simbólica de música, que opera sobre formatos de más alto nivel como MIDI, adoptamos un enfoque musical no simbólico y trabajamos directamente sobre representaciones de más bajo nivel como son las muestras de audio y sus correspondientes representaciones frecuenciales. Tras una revisión de la historia de la composición algorítmica y de varios métodos de síntesis de audio, se utilizan autocodificadores convolucionales para comprimir y reconstruir notas musicales, y autocodificadores variacionales para sintetizar audio mediante el muestreo dentro de representaciones ocultas aprendidas. A lo largo del proyecto, se investigan diversas configuraciones y arquitecturas de modelos con el objetivo de mejorar la calidad de reconstrucción y generación de audio.
dc.description.abstractIn this Bacherlor’s Thesis, deep learning is applied to musical audio reconstruction and generation, considering two architectures: autoencoders (AEs) and variational autoencoders (VAEs). Unlike symbolic music generation, which operates on higher-level formats such as MIDI, we adopt a non-symbolic approach and work directly with lower-level data such as raw audio samples and their corresponding frequency-domain transformations. Following an overview of the history of algorithmic composition and several methods of audio synthesis, convolutional autoencoders are used to compress and reconstruct musical notes, and variational autoencoders to synthesize audio by sampling within learned hidden representations. Throughout the project, various model settings and architectures are investigated in an attempt of enhancing reconstruction quality and generation performance.
dc.description.departmentDepto. de Sistemas Informáticos y Computación
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/123949
dc.language.isoeng
dc.page.total70
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu004(043.3)
dc.subject.keywordAprendizaje profundo
dc.subject.keywordAutocodificadores
dc.subject.keywordAutocodificadores variacionales
dc.subject.keywordEspacio latente
dc.subject.keywordEspectrograma
dc.subject.keywordRed convolucional
dc.subject.keywordDeep Learning
dc.subject.keywordAutoencoders
dc.subject.keywordVariational Autoencoders
dc.subject.keywordLatent space
dc.subject.keywordSpectro- gram
dc.subject.keywordConvolutional network
dc.subject.ucmInformática (Informática)
dc.subject.unesco33 Ciencias Tecnológicas
dc.titleAprendizaje de representaciones latentes de timbres musicales con autocodificadores y autocodificadores variacionales
dc.titleLearning latent representations of timbre using autoencoders and variational autoencoders
dc.typebachelor thesis
dc.type.hasVersionAM
dspace.entity.typePublication
relation.isAdvisorOfPublication52909b00-b705-4307-84db-d3211eedef69
relation.isAdvisorOfPublicationf0eee9a9-5f99-4e32-8f7e-db6418a011bc
relation.isAdvisorOfPublication.latestForDiscovery52909b00-b705-4307-84db-d3211eedef69

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Aprendizaje_representaciones_latentes.pdf
Size:
9.53 MB
Format:
Adobe Portable Document Format