Para depositar en Docta Complutense, identifícate con tu correo @ucm.es en el SSO institucional. Haz clic en el desplegable de INICIO DE SESIÓN situado en la parte superior derecha de la pantalla. Introduce tu correo electrónico y tu contraseña de la UCM y haz clic en el botón MI CUENTA UCM, no autenticación con contraseña.

Detección de Contenido Sexual en Audio y Texto mediante Transformers y Aprendizaje Federado en Dispositivos Android

dc.contributor.advisorGarcía Villalba, Luis Javier
dc.contributor.advisorPérez Arteaga, Sandra (Col. ext.)
dc.contributor.authorQiu, Jun
dc.date.accessioned2025-09-09T15:37:24Z
dc.date.available2025-09-09T15:37:24Z
dc.date.issued2025
dc.descriptionTrabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería de Software e Inteligencia Artificial, Curso 2024/2025.
dc.description.abstractEl avance tecnológico ha impactado potencialmente a la sociedad en las últimas décadas. Hoy en día, el uso de internet y de dispositivos móviles es cada vez más habitual y precoz. El presente trabajo tiene el objetivo de utilizar tecnologías de aprendizaje automático para detectar los posibles casos de ciberacoso conocido como grooming, cuyas víctimas principales son menores de edad. En este trabajo, se centra en el análisis de mensajes de texto y de audio con contenido sexual, en el que se entrenan diversos modelos con los conjuntos de datos existentes, con el fin de realizar un análisis y estudio detallado. Investigando si existen posibilidades de mejorar la predicción, y posteriormente se integra el modelo adecuado en una aplicación Android para analizar el funcionamiento de los modelos dentro de un dispositivo móvil, teniendo en cuenta que en este contexto la capacidad del cómputo de los dispositivos generalmente es más limitada. Tras la integración, se desarrollan unas funcionalidades en la aplicación como enviar una alerta en los posibles casos positivos de contenido sexual en el análisis de texto y audio. Además, se adopta el aprendizaje federado para permitir que el modelo pueda evolucionar con datos adicionales.
dc.description.abstractTechnological progress has potentially impacted society in recent decades. Nowadays, the use of internet and mobile devices is becoming more and more common and precocious. The present work aims to use machine learning technologies to detect possible cases of cyberbullying known as grooming, whose main victims are minors. This paper focuses on the analysis of text and audio messages with sexual content, in which various models are trained with existing datasets, in order to perform a detailed analysis and study. Investigating whether there are possibilities to improve the prediction, and subsequently integrating the appropriate model into an Android application to analyze the performance of the models within a mobile device, taking into account that in this context the computational capacity of the devices is generally more limited. After integration, functionalities are developed in the application such as sending an alert in possible positive cases of sexual content in text and audio analysis. In addition, federated learning is adopted to allow the model to evolve with additional data.
dc.description.departmentDepto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.identifier.urihttps://hdl.handle.net/20.500.14352/123792
dc.language.isospa
dc.master.titleMáster en Ingeniería Informática
dc.page.total59
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.cdu004(043.3)
dc.subject.keywordAndroid
dc.subject.keywordAprendizaje Automático
dc.subject.keywordAprendizaje Federado
dc.subject.keywordDetección de Contenido Sexual
dc.subject.keywordFine-tuning
dc.subject.keywordGrooming
dc.subject.keywordInteligencia Artificial
dc.subject.keywordModelo Extenso de Lenguaje
dc.subject.keywordTinyBERT
dc.subject.keywordArtificial Intelligence
dc.subject.keywordFederated Learning
dc.subject.keywordLarge Language Model
dc.subject.keywordMachine Learning
dc.subject.keywordSexual Content Detection
dc.subject.ucmInformática (Informática)
dc.subject.unesco33 Ciencias Tecnológicas
dc.titleDetección de Contenido Sexual en Audio y Texto mediante Transformers y Aprendizaje Federado en Dispositivos Android
dc.titleDetection of Sexual Content in Audio and Text using Transformers and Federated Learning on Android Devices
dc.typemaster thesis
dc.type.hasVersionAM
dspace.entity.typePublication
relation.isAdvisorOfPublication0f67f6b3-4d2f-4545-90e1-95b8d9f3e1f0
relation.isAdvisorOfPublication.latestForDiscovery0f67f6b3-4d2f-4545-90e1-95b8d9f3e1f0

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Detección_de_Contenido_Sexual_en_Audio.pdf
Size:
4.03 MB
Format:
Adobe Portable Document Format