Abstract:
|
Nesse artigo é abordado a validação de métricas de Mineração de dados, referentes a um software, denominado SDBayes, que foi desenvolvido em um projeto de pesquisa. O software faz a predição dos discente mais propensos a evadir ou permanecer em uma Instituição de Ensino Superior apresentando probabilidades de permanência e probabilidades de evasão, também utiliza Redes Bayesianas, que são métricas de classificação muito usadas para a área médica, pois simula muito bem o raciocínio humano. No entanto, as classificações feitas pelas Redes bayesianas nem sempre correspondem com a realidade do problema, com isso, foram abordadas, cinco técnicas de validação de dados, para estimar a real capacidade de predição do sistema desenvolvido. Os métodos usados foram: F-measure, K-fold, Hold-out, Leave-one-out e o Receiver Operating Characteristics (ROC). |