Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Análisis de sentimientos en redes sociales

Citation

Abstract

The main objective of this TFG is to determine through the study of different tweets and youtube comments the opinion of society regarding a topic on which it is relatively divided. Popular opinion and its change over time will be analyzed. For that we use different methods to process data and for being able to compare and create an approximation as close to reality as possible. The topic we have chosen is the trial between Johnny Depp and Amber Heard, a topic with a great media repercussion that has continued for many years and where social opinion has changed depending on the moment. For this project, We have found datasets that already exist in Kaggle, an online platform for data science and machine learning practitioners, which we also divided in two different groups. The first one contains the tweets obtained during the trials that took place between April and May 2022, and the second contains commentaries of live broadcasts of the Law & Crime channel, which was the most used channel to watch the trial live. Then, using NLP libraries we will clean the datasets for its further processing. This cleaning involves removing any element that is not useful for the analysis. In the end, we will have a set of words, which will be analyzed and from we will make final conclusions with an exhaustive evaluation. The descriptive analysis includes relevant statistics such as the most used words or the most used verbs. Vectorization is also applied to datasets, which is the last step before obtaining the sentiments. The final analysis is performed in the same way by processing a pre-classified corpus of data and then using it to train several Machine Learning classification models. This is essential, because once these models are trained, they can be applied on the original datasets to extract their sentiment, classifying them and being able to make temporal series. Those will be the final results.
El principal objetivo de este TFG es determinar mediante el estudio de diferentes tuits y comentarios de Youtube la opinión de la sociedad respecto a un tema sobre el que se encuentra relativamente dividida. Se analizará la opinión popular y su cambio en el tiempo. Para eso utilizamos diferentes métodos para procesar los datos y poder comparar y crear una aproximación lo más cercana posible a la realidad. El tema que hemos elegido es el juicio entre Johnny Depp y Amber Heard, un tema con una gran repercusión mediática que se ha prolongado durante muchos años y donde la opinión social ha ido cambiando según el momento. Para este proyecto hemos encontrado conjuntos de datos que ya existen en Kaggle, una plataforma en línea para profesionales de ciencia de datos y aprendizaje automático, que también dividimos en dos grupos diferentes. El primero contiene los tuits obtenidos durante los juicios que se llevaron a cabo entre abril y mayo de 2022, y el segundo contiene comentarios de transmisiones en vivo del canal Law & Crime, que fue el canal más utilizado para ver el juicio en vivo. Luego, utilizando las bibliotecas NLP, limpiaremos los conjuntos de datos para su posterior procesamiento. Esta limpieza consiste en eliminar cualquier elemento que no sea útil para el análisis. Al final tendremos un conjunto de palabras, las cuales serán analizadas y a partir de las cuales sacaremos conclusiones finales con una evaluación exhaustiva. El análisis descriptivo incluye estadísticas relevantes como las palabras más usadas o los verbos más usados. La vectorización también se aplica a conjuntos de datos, que es el último paso antes de obtener los sentimientos. El análisis final se realiza de la misma manera procesando un corpus de datos preclasificados y luego usándolo para entrenar varios modelos de clasificación de Machine Learning. Esto es fundamental, porque una vez entrenados estos modelos, se pueden aplicar sobre los datasets originales para extraer su sentimiento, clasificarlos y poder hacer series temporales. Esos serán los resultados finales.

Research Projects

Organizational Units

Journal Issue

Description

Trabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Sistemas Informáticos y Computación, Curso 2022/2023.

Keywords