Title: | Modelo classificador automático de polaridade de opiniões no Facebook® |
Author: | Bueno, João Augusto da Silva |
Abstract: |
As campanhas de prevenção a doenças, principalmente as realizadas na internet, são de suma importância nos dias atuais, pois por meio delas é possível entender, em tempo real, ao menos parcialmente, se a campanha está sendo bem recebida pela população. Para esse monitoramento é necessário acompanhamento automático, que trabalhe como ferramenta auxiliadora dos gestores nos processos de tomada de decisão. A proposta deste estudo é desenvolver e analisar um modelo classificador automático de polaridade das opiniões, aplicado às postagens sobre o câncer de próstata da página denominada Novembro Azul no Facebook®, no período de novembro de 2018. O presente estudo é uma produção tecnológica inovadora de natureza quantitativa. Foi desenvolvido em cinco etapas, primeiramente, foram extraídos os dados da rede social para construção de um dataset em uma planilha eletrônica. Logo depois, na segunda etapa, foi realizado o pré-processamento dos dados, retirando os sufixos das palavras, removendo as palavras repetidas ou sem relevância na formação das frases. Em seguida, uma amostragem dos dados recebeu classificação: positiva ou negativa. Essa ordenação chamada de treinamento foi realizada por três especialistas em tecnologia. A quarta etapa foi voltada para a criação e utilização do algoritmo de aprendizagem de máquina, denominado naive bayes, que analisou e processou o treinamento que os classificadores especialistas realizaram na etapa anterior, fazendo a classificação de forma automática do restante do material disponível na base de dados. Na sequência, foi efetivada a análise do modelo, medida a sua acurácia e aplicados métodos para auxiliar na visualização dos resultados, podendo assim ser realizadas alterações para ajustes no código fonte. O modelo obteve no teste da acurácia o resultado de 84,8% na classificação automática das opiniões em relação à classificação dos especialistas, concluindo assim que o modelo implementado poderá auxiliar os gestores das campanhas de saúde nos processos de tomada de decisão. Abstract: Disease prevention campaigns, especially those carried out on the Internet, are of paramount importance today, because through them it is possible to understand, in real time, at least partially, if the campaign is being well received by the population. This requires automatic monitoring, which works as an auxiliary tool for managers in decision-making processes. The purpose of this study is to develop and analyze an automatic opinion polarity classifier model applied to the postings on prostate cancer on the Facebook® page named November Blue, in November 2018. This study is an innovative technological production of quantitative nature. It was developed in five steps. First, we extracted data from the social network to build a dataset in an electronic spreadsheet. Soon after, in the second stage, the data was preprocessed, removing the suffixes of the words, the words repeated or not relevant in the formation of the sentences. Then a sampling of the data was graded: positive or negative. This ordination named training was performed by three technology experts. The fourth step focused on the creation and use of the machine learning algorithm, called naive bayes, which analyzed and processed the training that the expert classifiers performed in the previous step, automatically classifying the remaining material available in the database. Subsequently, the model analysis was performed, its accuracy was measured and methods were applied to assist in the visualization of the results, thus making changes to adjustments to the source code. The model obtained in the accuracy test the result of 84.8% in the automatic classification of opinions in relation to the experts? classification, thus concluding that the implemented model may help health campaign managers in decision-making processes. |
Description: | Dissertação (mestrado profissional) - Universidade Federal de Santa Catarina, Centro de Ciências da Saúde, Programa de Pós-Graduação em Informática em Saúde, Florianópolis, 2019. |
URI: | https://repositorio.ufsc.br/handle/123456789/215471 |
Date: | 2019 |
Files | Size | Format | View |
---|---|---|---|
PGIS0020-D.pdf | 1.488Mb |
View/ |