Modelos de “Machine Learning” para la detección ideológica en Twitter: Evaluación y aplicación práctica
Loading...
Download
Official URL
Full text at PDC
Publication date
0025
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citation
Abstract
La era de la información trae consigo el creciente uso de redes sociales, este trabajo evalúa la capacidad de distintos modelos de aprendizaje automático y profundo para interpretar
emociones y clasificar contenido ideológico en mensajes publicados en Twitter. La metodología combina dos enfoques: uno experimental, basado en el entrenamiento y comparación de
modelos supervisados sobre un conjunto de datos etiquetado (Kaggle); y otro aplicado, donde se implementa un modelo de tipo Zero-Shot sobre un corpus real recolectado durante la
campaña electoral de 2024 mediante “web scraping”. Se analizan modelos basados en algoritmos clásicos (SVM, Regresión Logística, “Naive Bayes”, “Random Forest”, “Gradient
Boosting”, “Ridge Classifier” y “Passive-Aggressive”) y avanzados basados en lenguaje (BETO, SBERT, “Zero-Shot” con BART). Los resultados permiten valorar la precisión, escalabilidad y aplicabilidad práctica de cada técnica, demostrando que estas herramientas son útiles para automatizar el análisis de sentimientos, emociones e ideologías en entornos digitales
complejos como las redes sociales.
Description
In an age of information overload and widespread use of social networks, this study evaluates the effectiveness of various machine learning and deep learning models to interpret emotions and classify ideological content in Twitter messages. The methodology combines two approaches: an experimental phase based on training and comparing supervised models using a labeled dataset (Kaggle), and an applied case where a Zero-Shot model is implemented on a real-world corpus collected during the 2024 electoral campaign via web scraping. Both classical algorithms (SVM, Logistic Regression, Naive Bayes, Random Forest, Gradient Boosting, Ridge Classifier, and Passive-Aggressive) and advanced language-based models
(BETO, SBERT, Zero-Shot with BART) are analyzed. Results provide insight into the accuracy, scalability, and real-world applicability of each technique, confirming their utility for
automating the analysis of sentiment, emotions, and ideology in complex digital environments such as social media.