Sexual Content Detection on Resource-Limited Devices Using Deep Learning
Loading...
Official URL
Full text at PDC
Publication date
2023
Authors
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citation
Abstract
Nowadays, access to sexual content published on the Internet is quickly and easily available to anyone. This could harm anyone who does not have control over its consumption and, that is why in this project we want to find a tool that detects and limits it as much as possible. Our main objective is to detect sexual content in images on smartphones because they are the electronic devices that most people have access to. To do this, we retrained the MobileNetV1, MobileNetV2, MobileNetV3-Small and MobileNetV3-Large architectures of the TensorFlow library. This was done with datasets of images with sexual content and images without sexual content and, in this way, we get the models to be able to classify an image as sexual or not. In addition, we use the data augmentation technique to amplify our training datasets. In this way, we also managed to prepare the models to be able to perform good classifications to input images with different characteristics, for example, rotated images, images with lower quality, zoomed images, or, rotated images, among others. The results obtained with different datasets and different modifications of the architecture of the four versions of MobileNet show that the model that performs better and generalizes better when detecting this type of content is MobileNetV3-Small. With this work, we demonstrate that Deep Learning architectures are very useful for detecting explicit content in images and, that they could be used in the future for many different applications.
A día de hoy, el acceso a contenido sexual publicado en Internet está al alcance de cualquiera de manera rápida y sencilla. Esto podría llegar a perjudicar a cualquiera que no tenga un control sobre su consumo y, es por eso que, en este trabajo queremos encontrar una herramienta que lo detecte y lo restrinja lo máximo posible. Nuestro principal objetivo es conseguir detectar contenido sexual en imágenes dentro de smartphones porque son los dispositivos electrónicos a los que m ́as personas pueden acceder. Para ello, hemos reentrenado las arquitecturas basadas en redes neuronales convolucionales MobileNetV1, MobileNetV2, MobileNetV3-Small y MobileNetV3-Large con conjuntos de datos de imágenes con contenido sexual e imágenes sin contenido sexual y, de esta forma, conseguimos que los modelos puedan clasificar una imagen como sexual o no. Además, utilizamos la técnica de aumento de datos para ampliar nuestros conjuntos de datos de entrenamiento. De esta forma, también conseguimos preparar a los modelos para que sean capaces de realizar buenas clasificaciones a imágenes de entrada con distintas características, por ejemplo, imágenes rotadas, imágenes con menos calidad, imágenes con zoom o imágenes rotadas, entre otras. Los resultados obtenidos con distintos conjuntos de datos y distintas modificaciones de las cuatro versiones de MobileNet muestran que, el modelo que mejor se comporta y consigue generalizar mejor a la hora de detectar este tipo de contenido es el MobileNetV3-Small. Con este trabajo, demostramos que las arquitecturas de aprendizaje profundo son muy ́útiles frente a la detección de contenido explícito en imágenes y que podían ser utilizadas en un futuro para muchas aplicaciones diferentes.
A día de hoy, el acceso a contenido sexual publicado en Internet está al alcance de cualquiera de manera rápida y sencilla. Esto podría llegar a perjudicar a cualquiera que no tenga un control sobre su consumo y, es por eso que, en este trabajo queremos encontrar una herramienta que lo detecte y lo restrinja lo máximo posible. Nuestro principal objetivo es conseguir detectar contenido sexual en imágenes dentro de smartphones porque son los dispositivos electrónicos a los que m ́as personas pueden acceder. Para ello, hemos reentrenado las arquitecturas basadas en redes neuronales convolucionales MobileNetV1, MobileNetV2, MobileNetV3-Small y MobileNetV3-Large con conjuntos de datos de imágenes con contenido sexual e imágenes sin contenido sexual y, de esta forma, conseguimos que los modelos puedan clasificar una imagen como sexual o no. Además, utilizamos la técnica de aumento de datos para ampliar nuestros conjuntos de datos de entrenamiento. De esta forma, también conseguimos preparar a los modelos para que sean capaces de realizar buenas clasificaciones a imágenes de entrada con distintas características, por ejemplo, imágenes rotadas, imágenes con menos calidad, imágenes con zoom o imágenes rotadas, entre otras. Los resultados obtenidos con distintos conjuntos de datos y distintas modificaciones de las cuatro versiones de MobileNet muestran que, el modelo que mejor se comporta y consigue generalizar mejor a la hora de detectar este tipo de contenido es el MobileNetV3-Small. Con este trabajo, demostramos que las arquitecturas de aprendizaje profundo son muy ́útiles frente a la detección de contenido explícito en imágenes y que podían ser utilizadas en un futuro para muchas aplicaciones diferentes.
Description
Trabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2022/2023.