Algoritmos de aprendizagem de máquina na previsão da evasão nos cursos de engenharia da Universidade Federal de Santa Catarina

Repositório institucional da UFSC

A- A A+

Algoritmos de aprendizagem de máquina na previsão da evasão nos cursos de engenharia da Universidade Federal de Santa Catarina

Mostrar registro completo

Título: Algoritmos de aprendizagem de máquina na previsão da evasão nos cursos de engenharia da Universidade Federal de Santa Catarina
Autor: Curbani, Fernando
Resumo: A evasão universitária é um fenômeno preocupante que ocorre quando estudantes abandonam o ensino superior antes de concluírem seus cursos, essa é uma realidade comum em diversas instituições de ensino no Brasil e do mundo. Este trabalho tem como tema a evasão dos cursos de engenharia de uma universidade federal brasileira. O objetivo do estudo é realizar uma comparação do desempenho de diferentes algoritmos de aprendizagem de máquina na previsão da evasão dos alunos desses cursos. O estudo foi realizado na Universidade Federal de Santa Catarina, com uma amostra inicial de 4394 alunos. Para alcançar esse objetivo, o processo de CRISP-DM (Cross-Industry Standard Process for Data Mining) foi aplicado, utilizando variáveis independentes relacionadas a dados acadêmicos, socioeconômicos e demográficos em três momentos distintos: pré-matrícula, final do primeiro semestre e final do terceiro semestre. Os resultados obtidos revelaram uma Acurácia de 69,20%, 80,47% e 84,52% respectivamente nos três modelos analisados, com uma Sensibilidade máxima de 60,79% no Terceiro Semestre. Além disso, ao equilibrar os dados, a Sensibilidade aumentou para 79,93%. O ajuste do limiar de classificação também possibilitou uma maior capacidade de previsão dos estudantes propensos a evadir. A partir da avaliação dos modelos criados, o algoritmo Random Forest foi selecionado por ter trazido os melhores resultados de previsão.Abstract: University dropout is a concerning phenomenon where students abandon higher education before completing their courses, and it is a common reality in many educational institutions in Brazil and worldwide. This study focuses on dropout in engineering courses at a Brazilian federal university. The objective is to compare the performance of different machine learning algorithms in predicting dropout among students in these courses. The study was conducted at the Federal University of Santa Catarina, with an initial sample of 4394 students. To achieve this goal, the CRISP-DM (Cross-Industry Standard Process for Data Mining) process was applied, using independent variables related to academic, socioeconomic, and demographic data at three different time points: pre-enrollment, end of the first semester, and end of the third semester. The results revealed an accuracy of 69.20%, 80.47%, and 84.52%, respectively, in the three analyzed models, with a maximum sensitivity of 60.79% in the third semester. Furthermore, by balancing the data, sensitivity increased to 79.93%. Adjusting the classification threshold also improved the ability to predict students at risk of dropout. Based on the evaluation of the created models, the Random Forest algorithm was selected as it provided the best prediction results.
Descrição: Dissertação (mestrado profissional) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Métodos e Gestão em Avaliação, Florianópolis, 2023.
URI: https://repositorio.ufsc.br/handle/123456789/249947
Data: 2023


Arquivos deste item

Arquivos Tamanho Formato Visualização
PMGA0068-D.pdf 2.331Mb PDF Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro completo

Buscar DSpace


Navegar

Minha conta

Estatística

Compartilhar