Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Detección de contenido sensible en audio usando técnicas de Aprendizaje Profundo

Loading...
Thumbnail Image

Official URL

Full text at PDC

Publication date

2024

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations
Google Scholar

Citation

Abstract

Actualmente, ha aumentado la creación y el consumo de contenido en internet, lo que ha facilitado la difusión de material ilegal como la pornografía infantil. Un desafío importante en la lucha contra este problema es que los vídeos subidos a internet no siempre muestran desnudez explícita, lo que dificulta su detección mediante métodos convencionales como el análisis de imágenes. El audio, a menudo pasado por alto, puede contener características que otros modelos no pueden detectar. Este trabajo trata de desarrollar una tecnología capaz de identificar y clasificar este tipo de contenido a través del análisis de audio. La principal motivación es proporcionar herramientas más efectivas para combatir la difusión de estos materiales. El estudio se centra en la implementación de tecnologías para detectar contenido sensible en audio. Se desarrollaron y evaluaron modelos basados en aprendizaje profundo para analizar fragmentos de audio de vídeos. A pesar de los resultados positivos, el modelo presenta limitaciones como la mala clasificación de sonidos de agua y la dependencia de la calidad del audio. Se alcanza una precisión superior al 90 %, pero siempre hay margen de mejora. El trabajo futuro sugiere un análisis detallado de los fallos del modelo, la incorporación de la temporalidad en el análisis de secuencias, y la experimentación con tecnologías más avanzadas. También se propone mejorar el conjunto de datos para aumentar la robustez del modelo.
Currently, the creation and consumption of content on the internet have increased, facilitating the spread of illegal material such as child pornography. An important challenge in combating this issue is that videos uploaded to the internet do not always show explicit nudity, making them difficult to detect using conventional methods like image analysis. Audio, often overlooked, can contain features that other models cannot detect. This work aims to develop a technology capable of identifying and classifying this type of content through audio analysis. The main motivation is to provide more effective tools to combat the spread of these materials. The study focuses on the implementation of technologies to detect sensitive content in audio. Deep learning-based models were developed and evaluated to analyze audio fragments from videos. Despite the positive results, the model presents limitations such as the misclassification of water sounds and dependency on audio quality. A precision of over 90 % is achieved, but there is always room for improvement. Future work suggests a detailed analysis of model failures, the incorporation of temporality in sequence analysis, and experimentation with more advanced technologies. It also proposes improving the dataset to increase the model’s robustness.

Research Projects

Organizational Units

Journal Issue

Description

Trabajo de Fin de Grado en Ingeniería del Software, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2023/2024. El presente Trabajo Fin de Grado se enmarca dentro de un proyecto de investigación titulado Child protection centred strategies to fight against sexual abuse and exploitation– ALUNA, aprobado por la Comisión Europea en la convocatoria ISF-2021-TF1-AG-CYBER en virtud del acuerdo de subvención número 101084929 y en el que participa como coordinador del proyecto el Grupo GASS de la Universidad Complutense de Madrid (Grupo de Análisis, Seguridad y Sistemas, https://gass.ucm.es, grupo 910623 del catálogo de grupos de investigación reconocidos por la UCM.

Keywords