Publication:
Online hate speech detection using Machine Learning

dc.contributor.advisorMéndez Pozo Pablo, Gonzalo
dc.contributor.advisorGervás Gómez-Navarro, Pablo
dc.contributor.authorShepherd Arévalo, Ela Katherine
dc.date.accessioned2023-06-16T13:24:39Z
dc.date.available2023-06-16T13:24:39Z
dc.date.issued2022-09-16
dc.degree.titleGrado en Ingeniería Informática
dc.descriptionTrabajo de Fin de Grado en Ingeniería informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2021/2022. Enlace al repositorio público del proyecto: https://github.com/NILGroup/TFG-2122HateSpeechDetection
dc.description.abstractHate speech directed towards marginalized people is a very common problem online, especially in social media such as Twitter or Reddit. Automatically detecting hate speech in such spaces can help mend the Internet and transform it into a safer environment for everybody. Hate speech detection fits into text classification, a series of tasks where text is organized into categories. This project2 proposes using Machine Learning algorithms to detect hate speech in online text in four languages: English, Spanish, Italian and Portuguese. The data to train the models was obtained from online, publicly available datasets. Three different algorithms with varying parameters have been used in order to compare their performance. The experiments show that the best results reach an 82.51% accuracy and around an 83% F1-score, for Italian text. Each language has different results depending on distinct factors.
dc.description.abstractEl discurso de odio dirigido a personas marginadas es un problema muy común en línea, especialmente en redes sociales como Twitter o Reddit. La detección automática del discurso de odio en dichos espacios puede ayudar a reparar Internet y a transformarlo en un entorno más seguro para todos. La detección del discurso de odio encaja en la clasificación de texto, donde se organiza en categorías. Este proyecto1 propone el uso de algoritmos de Machine Learning para localizar discurso de odio en textos online en cuatro idiomas: inglés, español, italiano y portugués. Los datos para entrenar los modelos se obtuvieron de datasets disponibles públicamente en línea. Se han utilizado tres algoritmos diferentes con distintos parámetros para comparar su rendimiento. Los experimentos muestran que los mejores resultados alcanzan una precisión del 82,51 % y un valor F1 de alrededor del 83 % en italiano. Los resultados para cada idioma varían dependiendo de distintos factores.
dc.description.departmentDepto. de Ingeniería de Software e Inteligencia Artificial (ISIA)
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.eprint.idhttps://eprints.ucm.es/id/eprint/75015
dc.identifier.relatedurlhttps://github.com/NILGroup/TFG-2122HateSpeechDetection
dc.identifier.urihttps://hdl.handle.net/20.500.14352/3308
dc.language.isoeng
dc.page.total113
dc.rightsAtribución-NoComercial 3.0 España
dc.rights.accessRightsopen access
dc.rights.urihttps://creativecommons.org/licenses/by-nc/3.0/es/
dc.subject.cdu004(043.3)
dc.subject.keywordArtificial Intelligence
dc.subject.keywordMachine Learning
dc.subject.keywordHate Speech
dc.subject.keywordNLP
dc.subject.keywordText classification
dc.subject.keywordSocial media
dc.subject.keywordTwitter.
dc.subject.keywordInteligencia Artificial
dc.subject.keywordDiscurso de odio
dc.subject.keywordPLN
dc.subject.keywordClasificación de textos
dc.subject.keywordRedes sociales
dc.subject.keywordTwitter
dc.subject.ucmInformática (Informática)
dc.subject.unesco1203.17 Informática
dc.titleOnline hate speech detection using Machine Learning
dc.title.alternativeDetección de discurso de odio online utilizando Machine Learning
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication71525cd5-263b-4c8d-aaa6-b604546c530a
relation.isAdvisorOfPublication.latestForDiscovery71525cd5-263b-4c8d-aaa6-b604546c530a
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
1901550085 - ELA KATHERINE SHEPHERD ARÉVALO 85233_ELA_KATHERINE_SHEPHERD_AREVALO_TFG_DETECCION_DE_DISCURSO_DE_ODIO_ONLINE_UTILIZANDO_MACHINE_LEARNING_-_Ela_K_Shepherd_Arevalo_1398833_4484022.pdf
Size:
1.32 MB
Format:
Adobe Portable Document Format