Detección de manipulaciones Copy-Move y Splicing en audio usando técnicas de Aprendizaje Profundo
Loading...
Official URL
Full text at PDC
Publication date
2024
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citation
Abstract
En la actualidad, con el desarrollo tecnológico de los últimos años y el creciente uso de la redes sociales, es cada vez más frecuente la existencia de falsificaciones de archivos multimedia que se comparten y circulan en nuestro entorno. Además, debido a la sofisticación de las metodologías empleadas, cada vez es más difícil detectar las irregularidades en estos archivos. En este trabajo se propone una solución para la detección de estas manipulaciones, en
concreto centrándonos en archivos de audio. Para ello seguimos el enfoque de los algoritmos de aprendizaje profundo, presentados como la mejor solución de entre los métodos de inteligencia artificial existentes. Para este estudio se realiza una conversión de las muestras originales y modificadas en imágenes denominadas espectrogramas. Esta conversión se desarrolla con el objetivo de realizar un preprocesamiento para la correcta extracción de características y aprendizaje del modelo. La arquitectura del mismo, representada como una red neuronal, es capaz de identificar estas muestras etiquetadas en un proceso de entrenamiento y validación. Estos modelos se caracterizan por su robustez y escalabilidad, lo que permite la inclusión de varias categorías de alteración de muestras al estudio. Concretamente, este trabajo presenta una clasificación en tres categorías distintas. Los experimentos demuestran que este tipo de análisis tiene resultados excelentes con algoritmos de aprendizaje automático y que, por lo tanto, suponen un enfoque eficiente.
In recent years, the technological improvement and the growing use of social media has taken part in the proliferation of numerous counterfeit multimedia content in our environement. Moreover, due to the sophistication of the methodologies employed, it has progressively become more difficult to detect the irregularities in these files. This work proposes a solution for the detection of these manipulations, specifically focusing on audio files. To achieve this, we follow the approach of deep learning algorithms, presented as the best solution among the existing artificial intelligence methods. For this study, we performed a conversion of the original and modified samples into images called spectrograms. This conversion is carried out in order to perform a preprocessing phase of the samples and, then, satisfy the correct feature extraction and learning process by the model. The architecture of the model, represented as a neural network, is capable of identifying these labeled samples in a training and validation process. These models are characterized by their robustness and scalability, which allows the inclusion of various categories of forgeries in the study. Concretely, this work presents a classification into three different categories. The experiments illustrates that this type of analysis has achieved excellent results with machine learning algorithms and, therefore, represents an efficient approach.
In recent years, the technological improvement and the growing use of social media has taken part in the proliferation of numerous counterfeit multimedia content in our environement. Moreover, due to the sophistication of the methodologies employed, it has progressively become more difficult to detect the irregularities in these files. This work proposes a solution for the detection of these manipulations, specifically focusing on audio files. To achieve this, we follow the approach of deep learning algorithms, presented as the best solution among the existing artificial intelligence methods. For this study, we performed a conversion of the original and modified samples into images called spectrograms. This conversion is carried out in order to perform a preprocessing phase of the samples and, then, satisfy the correct feature extraction and learning process by the model. The architecture of the model, represented as a neural network, is capable of identifying these labeled samples in a training and validation process. These models are characterized by their robustness and scalability, which allows the inclusion of various categories of forgeries in the study. Concretely, this work presents a classification into three different categories. The experiments illustrates that this type of analysis has achieved excellent results with machine learning algorithms and, therefore, represents an efficient approach.
Description
Trabajo de Fin de Grado en Ingeniería Informática, Trabajo de Fin de Grado en Ingeniería de Computadores, Departamento de Ingeniería del Software e Inteligencia Artificial, Facultad de Informática UCM, Curso 2023/2024.
El presente Trabajo Fin de Grado (TFG) se en marca dentro de un proyecto de investigación titulado Child protection centred strategies to fight against sexual abuse and exploitation – ALUNA, aprobado por la Comisión Europea (CE) en la convocatoria ISF-2021-TF1-AG-CYBER en virtud del acuerdo de subvención número 101084929 y en el que participa como coordinador del proyecto el Grupo de Análisis, Seguridad y Sistemas (GASS) de la Universidad Complutense de Madrid (UCM) (Grupo 910623 del catálogo de grupos de investigación reconocidos por la UCM, https://gass.ucm.es).