Para depositar en Docta Complutense, identifícate con tu correo @ucm.es en el SSO institucional: Haz clic en el desplegable de INICIO DE SESIÓN situado en la parte superior derecha de la pantalla. Introduce tu correo electrónico y tu contraseña de la UCM y haz clic en el botón MI CUENTA UCM, no autenticación con contraseña.
 

Modelos de “Machine Learning” para la detección ideológica en Twitter: Evaluación y aplicación práctica

Loading...
Thumbnail Image

Official URL

Full text at PDC

Publication date

0025

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations
Google Scholar

Citation

Abstract

La era de la información trae consigo el creciente uso de redes sociales, este trabajo evalúa la capacidad de distintos modelos de aprendizaje automático y profundo para interpretar emociones y clasificar contenido ideológico en mensajes publicados en Twitter. La metodología combina dos enfoques: uno experimental, basado en el entrenamiento y comparación de modelos supervisados sobre un conjunto de datos etiquetado (Kaggle); y otro aplicado, donde se implementa un modelo de tipo Zero-Shot sobre un corpus real recolectado durante la campaña electoral de 2024 mediante “web scraping”. Se analizan modelos basados en algoritmos clásicos (SVM, Regresión Logística, “Naive Bayes”, “Random Forest”, “Gradient Boosting”, “Ridge Classifier” y “Passive-Aggressive”) y avanzados basados en lenguaje (BETO, SBERT, “Zero-Shot” con BART). Los resultados permiten valorar la precisión, escalabilidad y aplicabilidad práctica de cada técnica, demostrando que estas herramientas son útiles para automatizar el análisis de sentimientos, emociones e ideologías en entornos digitales complejos como las redes sociales.

Research Projects

Organizational Units

Journal Issue

Description

In an age of information overload and widespread use of social networks, this study evaluates the effectiveness of various machine learning and deep learning models to interpret emotions and classify ideological content in Twitter messages. The methodology combines two approaches: an experimental phase based on training and comparing supervised models using a labeled dataset (Kaggle), and an applied case where a Zero-Shot model is implemented on a real-world corpus collected during the 2024 electoral campaign via web scraping. Both classical algorithms (SVM, Logistic Regression, Naive Bayes, Random Forest, Gradient Boosting, Ridge Classifier, and Passive-Aggressive) and advanced language-based models (BETO, SBERT, Zero-Shot with BART) are analyzed. Results provide insight into the accuracy, scalability, and real-world applicability of each technique, confirming their utility for automating the analysis of sentiment, emotions, and ideology in complex digital environments such as social media.

Keywords