Classificação de manchetes de cunho violento por meio de mineração de texto.

DSpace Repository

A- A A+

Classificação de manchetes de cunho violento por meio de mineração de texto.

Show full item record

Title: Classificação de manchetes de cunho violento por meio de mineração de texto.
Author: Battiston, Tiago
Abstract: A crescente disseminação de conteúdos violentos nos meios digitais impacta diretamente a percepção social de segurança. Este trabalho propõe uma solução baseada em técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (AM) para a identificação automática de manchetes violentas em portais de notícias. Para isso, desenvolveu-se um algoritmo de web scraping que coletou 20 mil notícias, das quais 5.000 foram analisadas manualmente para compor a base de treinamento. Após etapas de pré-processamento, vetorização por TF-IDF e balanceamento de dados, treinou-se um classificador Multinomial Naive Bayes, para a identificação de notícias violentas, que apresentou acurácia de 86% e métricas consistentes, como precisão de 91%, recall de 86% e F1-score de 88%. A aplicação prática do modelo confirmou sua viabilidade para cenários reais, abrindo perspectivas para futuras melhorias, como inclusão de subcategorias e integração em ferramentas de filtragem de conteúdo.The increasing dissemination of violent content in digital media directly impacts the social perception of security. This work proposes a solution based on Natural Language Processing (NLP) and Machine Learning (ML) techniques for the automatic identification of violent headlines in news portals. To achieve this, an algorithm for web scraping was developed, which collected 20,000 news articles, of which 5,000 were manually analyzed to compose the training dataset. After preprocessing steps, TF-IDF vectorization, and data balancing, a Multinomial Naive Bayes classifier was trained for the identification of violent news, achieving an accuracy of 86% and consistent metrics, such as precision of 91%, recall of 86%, and F1-score of 88%. The practical application of the model confirmed its feasibility for real-world scenarios, opening perspectives for future improvements, such as the inclusion of subcategories and integration into content filtering tools.
Description: TCC (graduação) - Universidade Federal de Santa Catarina, Campus Blumenau, Engenharia de Controle e Automação.
URI: https://repositorio.ufsc.br/handle/123456789/271510
Date: 2025-12-16


Files in this item

Files Size Format View Description
TCC Tiago Battiston.pdf 1.988Mb PDF View/Open TCC

This item appears in the following Collection(s)

Show full item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

Compartilhar