Aprendizaje de representaciones latentes de timbres musicales con autocodificadores y autocodificadores variacionales
| dc.contributor.advisor | Palomino Tarjuelo, Miguel | |
| dc.contributor.advisor | Sánchez Hernández, Jaime | |
| dc.contributor.author | García López, Pablo | |
| dc.date.accessioned | 2025-09-15T16:16:40Z | |
| dc.date.available | 2025-09-15T16:16:40Z | |
| dc.date.issued | 2025 | |
| dc.degree.title | Grado en Ingeniería Informática | |
| dc.description | Trabajo de Fin de Grado en Ingeniería Informática, Facultad Informática UCM, Dpto. de Sistemas Informáticos y Computación. Curso 2024/2025. | |
| dc.description.abstract | En este trabajo de fin de grado se aplica el aprendizaje profundo a la reconstrucción y generación de audio musical, considerando dos arquitecturas: autocodificadores (AEs) y autocodificadores variacionales (VAEs). A diferencia de la generación simbólica de música, que opera sobre formatos de más alto nivel como MIDI, adoptamos un enfoque musical no simbólico y trabajamos directamente sobre representaciones de más bajo nivel como son las muestras de audio y sus correspondientes representaciones frecuenciales. Tras una revisión de la historia de la composición algorítmica y de varios métodos de síntesis de audio, se utilizan autocodificadores convolucionales para comprimir y reconstruir notas musicales, y autocodificadores variacionales para sintetizar audio mediante el muestreo dentro de representaciones ocultas aprendidas. A lo largo del proyecto, se investigan diversas configuraciones y arquitecturas de modelos con el objetivo de mejorar la calidad de reconstrucción y generación de audio. | |
| dc.description.abstract | In this Bacherlor’s Thesis, deep learning is applied to musical audio reconstruction and generation, considering two architectures: autoencoders (AEs) and variational autoencoders (VAEs). Unlike symbolic music generation, which operates on higher-level formats such as MIDI, we adopt a non-symbolic approach and work directly with lower-level data such as raw audio samples and their corresponding frequency-domain transformations. Following an overview of the history of algorithmic composition and several methods of audio synthesis, convolutional autoencoders are used to compress and reconstruct musical notes, and variational autoencoders to synthesize audio by sampling within learned hidden representations. Throughout the project, various model settings and architectures are investigated in an attempt of enhancing reconstruction quality and generation performance. | |
| dc.description.department | Depto. de Sistemas Informáticos y Computación | |
| dc.description.faculty | Fac. de Informática | |
| dc.description.refereed | TRUE | |
| dc.description.status | unpub | |
| dc.identifier.uri | https://hdl.handle.net/20.500.14352/123949 | |
| dc.language.iso | eng | |
| dc.page.total | 70 | |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.accessRights | open access | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.cdu | 004(043.3) | |
| dc.subject.keyword | Aprendizaje profundo | |
| dc.subject.keyword | Autocodificadores | |
| dc.subject.keyword | Autocodificadores variacionales | |
| dc.subject.keyword | Espacio latente | |
| dc.subject.keyword | Espectrograma | |
| dc.subject.keyword | Red convolucional | |
| dc.subject.keyword | Deep Learning | |
| dc.subject.keyword | Autoencoders | |
| dc.subject.keyword | Variational Autoencoders | |
| dc.subject.keyword | Latent space | |
| dc.subject.keyword | Spectro- gram | |
| dc.subject.keyword | Convolutional network | |
| dc.subject.ucm | Informática (Informática) | |
| dc.subject.unesco | 33 Ciencias Tecnológicas | |
| dc.title | Aprendizaje de representaciones latentes de timbres musicales con autocodificadores y autocodificadores variacionales | |
| dc.title | Learning latent representations of timbre using autoencoders and variational autoencoders | |
| dc.type | bachelor thesis | |
| dc.type.hasVersion | AM | |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | 52909b00-b705-4307-84db-d3211eedef69 | |
| relation.isAdvisorOfPublication | f0eee9a9-5f99-4e32-8f7e-db6418a011bc | |
| relation.isAdvisorOfPublication.latestForDiscovery | 52909b00-b705-4307-84db-d3211eedef69 |
Download
Original bundle
1 - 1 of 1
Loading...
- Name:
- Aprendizaje_representaciones_latentes.pdf
- Size:
- 9.53 MB
- Format:
- Adobe Portable Document Format


