Mostrar el registro sencillo del ítem

dc.contributor.authorGarcía Pérez, Víctor
dc.contributor.otherBerlanga Llavori, Rafael
dc.contributor.otherUniversitat Jaume I. Departament de Llenguatges i Sistemes Informàtics
dc.date.accessioned2019-01-29T10:56:34Z
dc.date.available2019-01-29T10:56:34Z
dc.date.issued2018-10
dc.identifier.urihttp://hdl.handle.net/10234/180348
dc.descriptionTreball final de Màster Universitari en Sistemes Intel.ligents (Pla de 2013). Codi: SIE043. Curs acadèmic 2017-2018ca_CA
dc.description.abstractEarly in the 90s when social networks emerged, the number of users and the amount of information shared and published in them has undergone an exponential growth. In this work we will focus on the social network Twitter, which had at the beginning of 2018 with 330 million users. The goal of this work is to predict which of all the tweets obtained through a domain query are relevant or irrelevant for a subsequent analysis phase. For this, first, a bibliographic search has been made to find out the state of the art on similar topics. Secondly, a semi-manual method has been developed to perform the tagging of the dataset where the tweets have been identified according to the type they belong to, namely: relevant or irrelevant. Then a statistical analysis of the data has been carried out to find an adequate automatic classification method according to the selected evaluation metrics. All the experiments have been carried out with the help of data mining and text processing libraries available for Python.ca_CA
dc.description.abstractDesde principio de los años 90 cuando surgieron las redes sociales, el número de usuarios y la cantidad de información compartida y publicada en ellas ha experimentado un crecimiento exponencial. En este trabajo nos centraremos en la red social Twitter, que contaba a principios de 2018 con 330 millones de usuarios. El objetivo de este trabajo es conseguir predecir cuáles de todos los tweets recogidos a través de una consulta de dominio son relevantes o irrelevantes para una fase de análisis posterior. Para ello, en primer lugar, se ha realizado un barrido bibliográfico para consultar el estado del arte en temas similares. En segundo lugar, se ha elaborado un método semi-manual para realizar el etiquetado del dataset donde se han identificado los tweets en función de la clase a la que pertenecen, relevantes o irrelevantes. Después se ha realizado un análisis estadístico de los datos para buscar un método de clasificación adecuado según las métricas de evaluación seleccionadas. Todos los experimentos han sido realizados con la ayuda de las librerías de minería de datos y tratamiento de texto disponibles para Python.ca_CA
dc.format.extent55 p.ca_CA
dc.format.mimetypeapplication/pdfca_CA
dc.language.isospaca_CA
dc.publisherUniversitat Jaume Ica_CA
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectMàster Universitari en Sistemes Intel·ligentsca_CA
dc.subjectMáster Universitario en Sistemas Inteligentesca_CA
dc.subjectMaster's Degree in Intelligent Systemsca_CA
dc.subjectanálisis de redes socialesca_CA
dc.subjectclasificación automáticaca_CA
dc.subjectminería de textosca_CA
dc.titleDetección automática de tweets no relevantes en streams guiados por consultaca_CA
dc.typeinfo:eu-repo/semantics/masterThesisca_CA
dc.educationLevelEstudios de Postgradoca_CA
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessca_CA


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Excepto si se señala otra cosa, la licencia del ítem se describe como: Attribution-NonCommercial-NoDerivatives 4.0 Internacional