Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Detección offline de subtemas en Twitter durante eventos

dc.contributor.advisorCaballero Roldán, Rafael
dc.contributor.authorJiménez del Olmo, Beatriz
dc.date.accessioned2023-06-18T00:48:21Z
dc.date.available2023-06-18T00:48:21Z
dc.date.issued2018
dc.descriptionMáster en Ingeniería Informática, Facultad de Informática, Departamento de Sistemas Informáticos y Computación, curso 2017-2018.
dc.description.abstractHoy en día las redes sociales juegan un papel muy importante en nuestras vidas, al convertirse en el principal medio para compartir todo tipo de contenidos, desde la opinión de los usuarios sobre programas de televisión favoritos o las experiencias de su día a día, hasta comentarios sobre las noticias de última hora. Su estudio puede revelar aspectos muy interesantes para analistas, si somos capaces de extraer la valiosa información incrustada en sus inmensos flujos de información. Por ello, en este trabajo se presenta un método de exploración para Twitter que, a partir del conjunto de tweets emitidos durante un evento, permite detectar los temas que, a juicio de los usuarios, han tenido mayor relevancia durante su desarrollo. Permite, por tanto, analizar el evento obteniendo una imagen general de lo más comentado. El método propuesto presenta un enfoque que parte de la relación temporal entre los tweets, considerando que tweets que se emiten en una misma ventana de tiempo tienen más posibilidades de formar parte de una noticia, para a continuación agrupar los tweets de la misma ventana según su similaridad textual. Una vez detectados los temas del evento analizado, se proponen dos métodos de agrupación y representación de los resultados, permitiendo al usuario organizar los temas según dos criterios diferentes, ya sea por la proximidad temporal entre ellos o bien por la relación textual entre los temas que debaten. Para probar la capacidad de detección del método, se ha aplicado sobre conjuntos de datos de eventos de diferentes características, que tienen en común su alto seguimiento en Twitter.
dc.description.abstractNowadays Social Media plays an important role in our life. It has become the main way to share all kinds of content, from users’ opinion about their favorites TV shows, their daily experiences, or commenting the breaking news. The study of these messages can reveal very important facts to analysts, but only after extracting the important information that is embedded in the huge flows of data. With this purpose, this work presents a method for Twitter exploration that, starting from a set of tweets published during an event, detects the topics that are more relevant based on the users opinion. Thus, the system analyzes the event, obtaining the highlights of the most commented topics. The proposed method considers first the temporal relation of the tweets, assuming that messages published on the same time window are more likely to be a member of the same topic. Then, those tweets that belong to the same window are clustered by their textual similarity. Once we detect the topics related to the analyzed event, we propose two methods to aggregate and represent the results, allowing the user to organize the topics either by temporal proximity among them or by the textual relation among their opinions. In order to test the detection ability of the method, the system has been tested in several datasets with specific characteristics, which have in common their high popularity in Twitter.
dc.description.departmentDepto. de Sistemas Informáticos y Computación
dc.description.facultyFac. de Informática
dc.description.refereedTRUE
dc.description.statusunpub
dc.eprint.idhttps://eprints.ucm.es/id/eprint/48808
dc.identifier.urihttps://hdl.handle.net/20.500.14352/19952
dc.language.isospa
dc.master.titleMáster en Ingeniería Informática
dc.page.total101
dc.rightsAtribución-NoComercial 3.0 España
dc.rights.accessRightsopen access
dc.rights.urihttps://creativecommons.org/licenses/by-nc/3.0/es/
dc.subject.cdu004.78:316.77
dc.subject.cdu519.237.8
dc.subject.cdu025.4.03:004
dc.subject.keywordDetección de temas
dc.subject.keywordRecuperación de información
dc.subject.keywordmicroblogs
dc.subject.keywordTwitter
dc.subject.keywordRedes sociales
dc.subject.keywordVisualización de datos
dc.subject.keywordTF-IDF
dc.subject.keywordSimilaridad textual
dc.subject.keywordClustering
dc.subject.keywordTopic detection
dc.subject.keywordInformation retrieval
dc.subject.keywordmicroblog
dc.subject.keywordSocial Media
dc.subject.keywordData visualization
dc.subject.keywordTextual similarity
dc.subject.ucmBases de datos (Informática)
dc.subject.ucmInteligencia artificial (Informática)
dc.subject.ucmRedes
dc.subject.unesco1203.04 Inteligencia Artificial
dc.titleDetección offline de subtemas en Twitter durante eventos
dc.typemaster thesis
dspace.entity.typePublication
relation.isAdvisorOfPublicationd17b0355-2695-449e-b06e-a34f4e27f120
relation.isAdvisorOfPublication.latestForDiscoveryd17b0355-2695-449e-b06e-a34f4e27f120

Download

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Memoria TFM Final- Beatriz Jiménez del Olmo.pdf
Size:
14.19 MB
Format:
Adobe Portable Document Format