Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens

Moser, Gustavo Vicente Barroso

Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens

Repositório institucional da UFSC

A- A A+

Entrar

Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens

Mostrar registro simples

dc.contributor	Universidade Federal de Santa Catarina.	pt_BR
dc.contributor.advisor	Dorneles, Carina Friedrich
dc.contributor.author	Moser, Gustavo Vicente Barroso
dc.date.accessioned	2022-12-23T20:59:05Z
dc.date.available	2022-12-23T20:59:05Z
dc.date.issued	2022-12-15
dc.identifier.uri	https://repositorio.ufsc.br/handle/123456789/243553
dc.description	TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.	pt_BR
dc.description.abstract	Com o crescimento do acesso aos meios de comunicação e a popularização das redes sociais, o termo fake news ganha cada vez mais forma e espaço. O termo é utilizado para denominar informações falsas, mentiras que circulam pelos meios de informação. Diferentemente de sátiras, fake news são publicadas com a intenção de enganar os leitores a fim de obter ganhos, sejam eles políticos ou financeiros, geralmente acompanhados de títulos sensacionalistas para chamar a atenção. O Twitter é uma rede social voltada para comunicação em tempo real utilizada por milhões de usuários, é nela que muitas fake news são divulgadas e conseguem tomar grandes proporções. A possibilidade de compartilhar informações com apenas um clique faz com que sua disseminação se dê muito rapidamente. Um exemplo atual diz respeito às fake news que têm circulado sobre temas voltados à saúde. Com o surto da COVID-19 pelo planeta, muitos viram oportunidades de gerar informações falsas a respeito do uso de máscaras, vacinas, entre outros. Portanto, nesse contexto, o objetivo do presente trabalho é desenvolver uma solução para localizar tweets com informações cuja veracidade possa ser checada com experimentos publicados em artigos científicos, utilizando casamento de dados e similaridade semântica, posteriormente, classificando-os tweets como fraudulentos ou não.	pt_BR
dc.description.abstract	As the access to the media grows, and the popularity of social networks increases, the term "fake news" gets more and more form and space. This term is used to denote false information, lies that surround through the media. Unlike satires, the fake news are published intending to deceive readers in order to get gains that can be financial or political, and usually are followed by sensationalist titles to get attention. Twitter is a social network focused on real-time communication, used by millions of users. It is where a lot of news spread and can take large proportions. The possibility of sharing information with just one click makes the dissemination of it happen very quickly. A current example concerns the false news that have been circulating on health-related topics. While the outbreak of COVID-19 generates a crisis across the planet, many opportunities to create false information regarding the use of masks, vaccines, and others. Therefore, in this context, the objective of the present work is to develop a solution to locate tweets whose veracity can be checked with experiments published in scientific articles, using data matching and semantic similarity, and later classifying them as fraudulent or not.	pt_BR
dc.format.extent	98	pt_BR
dc.language.iso	pt_BR	pt_BR
dc.publisher	Florianópolis, SC.	pt_BR
dc.rights	Open Access.
dc.subject	Notícias falsas	pt_BR
dc.subject	Twitter	pt_BR
dc.subject	Saúde	pt_BR
dc.subject	Casamento de dados	pt_BR
dc.subject	Word embeddings	pt_BR
dc.title	Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens	pt_BR
dc.type	TCCgrad	pt_BR

Arquivos deste item

Arquivos	Tamanho	Formato	Visualização	Descrição
monografia.pdf	1014.Kb	PDF	Visualizar/Abrir	TCC
ftd-tfidf-we-main.zip	1.181Mb	Desconhecido	Visualizar/Abrir	Código-fonte

Este item aparece na(s) seguinte(s) coleção(s)

TCC Ciências da Computação [853]
Ciências da Computação

Mostrar registro simples

Buscar DSpace

Navegar

Todo o repositório
Esta coleção

Minha conta

Entrar

Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens

Repositório institucional da UFSC

Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens

Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Buscar DSpace

Navegar

Todo o repositório

Esta coleção

Minha conta

Estatística

Compartilhar