Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Clasificación de tweets mediante modelos de aprendizaje supervisado

dc.contributor.advisorGarcía Ruiz, Yolanda
dc.contributor.authorChamorro Alvarado, Verónica Lucía
dc.date.accessioned2023-06-17T14:24:17Z
dc.date.available2023-06-17T14:24:17Z
dc.date.issued2018
dc.descriptionFacultad de Informática. Departamento de Sistemas Informáticos y Computación, curso 2017-2018
dc.description.abstractEn los últimos años las redes sociales han generado una gran cantidad de datos que se emplean como una fuente de información. En muchos casos el análisis de estas fuentes de información nos permite conocer casi al instante situaciones atípicas como por ejemplo accidentes de tráfico, congestión excesiva, el estado de las carreteras, etc. En este trabajo usamos Twitter como fuente datos y nos proponemos desarrollar un método para analizar el texto de un conjunto de tweets. Este método permite clasificar dichos tweets en 2 clases: “Tráfico”, “Contaminación”. Empleamos varios algoritmos de clasificación supervisada, que fueron previamente entrenados. Se estudiaron los siguientes cuatro algoritmos, Bayes Naive multiclase, arboles de decisión, k-vecinos más cercanos y máquina de vectores de soporte, para obtener la exactitud de cada uno, y analizar cuál es el mejor algoritmo de clasificación para este caso de estudio. En los resultados obtenidos, con el algoritmo máquina de vectores de soporte, se logra un valor de exactitud de 85.22 % para la clasificación de eventos de tráfico y no tráfico. Además, fuimos capaces de realizar la clasificación multiclase, donde se obtuvo un valor de exactitud de 78.84%.
dc.description.abstractIn recent years social networks have generated a large amount of data, which is used as a source of information for several applications. In many cases analyzing these sources of information allow us to know almost instantly atypical situations, such as traffic accidents, traffic jumps, state of the roads, etc. In this work we use Twitter as source of information, and we propose to develop a method to analize the text of a set of tweets. This method allows classifying those tweets into two classes: “Traffic” , and “Pollution”. We used several supervised classification algorithms, that were previously trained. The following four algorithms, Bayes Naive multiclase, decision trees, k-neighbors nearest and support vector machines, which were studied to obtain their accuracy, and to analyze the best classification algorithm for this case study. The results obtained, with the support vector machine algorithm, show an accuracy value of 85.22 % for the classification of traffic events and non-traffic. In addition, we were able to perform the multiclass classification, where the accuracy value is 78.84%.
dc.description.departmentDepto. de Sistemas Informáticos y Computación
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.eprint.idhttps://eprints.ucm.es/id/eprint/49774
dc.identifier.urihttps://hdl.handle.net/20.500.14352/14246
dc.language.isospa
dc.master.titleMáster en Ingeniería Informática
dc.page.total65
dc.rightsAtribución-NoComercial 3.0 España
dc.rights.accessRightsopen access
dc.rights.urihttps://creativecommons.org/licenses/by-nc/3.0/es/
dc.subject.cdu004.78:316.77(043.3)
dc.subject.cdu004.421(043.3)
dc.subject.keywordDetección de eventos de tráfico
dc.subject.keywordDetección de eventos de contaminación
dc.subject.keywordSVM
dc.subject.keywordAlgoritmos de clasificación
dc.subject.keywordTraffic event detection
dc.subject.keywordPollution event detection
dc.subject.keywordAlgorithms of classification
dc.subject.ucmInformática (Informática)
dc.subject.unesco1203.17 Informática
dc.titleClasificación de tweets mediante modelos de aprendizaje supervisado
dc.typemaster thesis
dspace.entity.typePublication
relation.isAdvisorOfPublicationa8407cea-9bae-431c-b2f4-658bbf72261d
relation.isAdvisorOfPublication.latestForDiscoverya8407cea-9bae-431c-b2f4-658bbf72261d

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TFM Veronica Chamorro Alvarado.pdf
Size:
1 MB
Format:
Adobe Portable Document Format