|
Abstract:
|
Este trabalho apresenta o desenvolvimento e a avaliação de modelos de regressão
logística para a predição da evasão universitária nos cursos de engenharia da Uni
versidade Federal de Santa Catarina. Foram utilizadas três bases de dados contendo
informações socioeconômicas, notas do vestibular e o desempenho acadêmico dos
estudantes ao longo do primeiro e do terceiro semestre. Como os conjuntos de dados
apresentavam desbalanceamento entre as classes (evadidos e não evadidos), aplicou
se a técnica de oversampling SMOTE na etapa de modelagem para mitigar vieses
decorrentes desse desequilíbrio. O desempenho dos modelos foi avaliado por meio
de métricas como acurácia, sensibilidade, especificidade, curva ROC e área sob a
curva (AUC), permitindo identificar quais modelos apresentam maior poder predi
tivo. Os resultados indicam que o modelo baseado nos dados do primeiro semestre
já é capaz de prever a evasão com boa precisão. Além disso, fatores como o Índice de
Aproveitamento Acumulado (IAA), a taxa de aprovação e algumas características
socioeconômicas mostraram-se relevantes na estimativa da probabilidade de evasão.
O trabalho contribui para o entendimento das variáveis associadas à evasão e pode
subsidiar políticas institucionais voltadas à permanência estudantil. |