Detección de contenido sensible en audio usando técnicas de Aprendizaje Profundo
Loading...
Official URL
Full text at PDC
Publication date
2024
Authors
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citation
Abstract
Actualmente, ha aumentado la creación y el consumo de contenido en internet, lo que ha facilitado la difusión de material ilegal como la pornografía infantil. Un desafío importante en la lucha contra este problema es que los vídeos subidos a internet no siempre muestran desnudez explícita, lo que dificulta su detección mediante métodos convencionales como el análisis de imágenes. El audio, a menudo pasado por alto, puede contener características que otros modelos no pueden detectar. Este trabajo trata de desarrollar una tecnología capaz de identificar y clasificar este tipo de contenido a través del análisis de audio. La principal motivación es proporcionar herramientas más efectivas para combatir la difusión de estos materiales. El estudio se centra en la implementación de tecnologías para detectar contenido sensible en audio. Se desarrollaron y evaluaron modelos basados en aprendizaje profundo para analizar fragmentos de audio de vídeos. A pesar de los resultados positivos, el modelo presenta limitaciones como la mala clasificación de sonidos de agua y la dependencia de la calidad del audio. Se alcanza una precisión superior al 90 %, pero siempre hay margen de mejora. El trabajo futuro sugiere un análisis detallado de los fallos del modelo, la incorporación de la temporalidad en el análisis de secuencias, y la experimentación con tecnologías más avanzadas. También se propone mejorar el conjunto de datos para aumentar la robustez del modelo.
Currently, the creation and consumption of content on the internet have increased, facilitating the spread of illegal material such as child pornography. An important challenge in combating this issue is that videos uploaded to the internet do not always show explicit nudity, making them difficult to detect using conventional methods like image analysis. Audio, often overlooked, can contain features that other models cannot detect. This work aims to develop a technology capable of identifying and classifying this type of content through audio analysis. The main motivation is to provide more effective tools to combat the spread of these materials. The study focuses on the implementation of technologies to detect sensitive content in audio. Deep learning-based models were developed and evaluated to analyze audio fragments from videos. Despite the positive results, the model presents limitations such as the misclassification of water sounds and dependency on audio quality. A precision of over 90 % is achieved, but there is always room for improvement. Future work suggests a detailed analysis of model failures, the incorporation of temporality in sequence analysis, and experimentation with more advanced technologies. It also proposes improving the dataset to increase the model’s robustness.
Currently, the creation and consumption of content on the internet have increased, facilitating the spread of illegal material such as child pornography. An important challenge in combating this issue is that videos uploaded to the internet do not always show explicit nudity, making them difficult to detect using conventional methods like image analysis. Audio, often overlooked, can contain features that other models cannot detect. This work aims to develop a technology capable of identifying and classifying this type of content through audio analysis. The main motivation is to provide more effective tools to combat the spread of these materials. The study focuses on the implementation of technologies to detect sensitive content in audio. Deep learning-based models were developed and evaluated to analyze audio fragments from videos. Despite the positive results, the model presents limitations such as the misclassification of water sounds and dependency on audio quality. A precision of over 90 % is achieved, but there is always room for improvement. Future work suggests a detailed analysis of model failures, the incorporation of temporality in sequence analysis, and experimentation with more advanced technologies. It also proposes improving the dataset to increase the model’s robustness.
Description
Trabajo de Fin de Grado en Ingeniería del Software, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2023/2024.
El presente Trabajo Fin de Grado se enmarca dentro de un proyecto de investigación titulado Child protection centred strategies to fight against sexual abuse and exploitation– ALUNA, aprobado por la Comisión Europea en la convocatoria
ISF-2021-TF1-AG-CYBER en virtud del acuerdo de subvención número 101084929 y en el que participa como coordinador del proyecto el Grupo GASS de la Universidad Complutense de Madrid (Grupo de Análisis, Seguridad y Sistemas, https://gass.ucm.es, grupo 910623 del catálogo de grupos de investigación reconocidos por la UCM.