|
Abstract:
|
Neste trabalho, é comparado o algoritmo de machine learning HyperFast, um modelo de machine learning que faz uso de meta-learning e hiper redes voltado para dados tabulares, na predição de mortalidade em até sete dias após a primeira entrada na Unidade Terapia Intensiva (UTI), usando dados coletados nas primeiras vinte quatro horas da estadia na UTI, com os algoritmos XGBoost e rede neural MLP (Multi-Layer Perceptron). Os dados foram extraídos do Medical Information Mart for Intensive Care IV (MIMIC-IV). Quatro conjuntos de dados foram criados. O primeiro é um conjunto sem balanceamento de classes e eliminação de medições outliers, o segundo foi retirando as medições outliers, o terceiro fez-se balanceamento de classes e o quarto, balanceamento de classes e eliminação de medições outliers. Os algoritmos foram testados em cada conjunto de dados. Os resultados dos algoritmos foram analisados, discutidos e comparados tendo em vista a robustez a presença de outliers no conjunto de dados e desbalanceamento de classes usando a métrica Área sob a curva Precision Recall (AUPRC) a métrica como principal métrica de avaliação. Especificamente, foi analisado o algoritmo MLP em comparação às métricas e tempo de treinamento/predição com o HyperFast, tendo em vista arquitetura similar e execução em CPU ou GPU. Os resultados mostraram que o algoritmo HyperFast é uma opção viável, pois o tempo de treinamento foi menor do que o tempo de um MLP com arquitetura similar da rede neural gerada pelo HyperFast, quando ambos rodam em CPU e sendo bem mais rápido quando rodado em GPU. Outro ponto é que o tempo de treino do HyperFast não dependeu do tamanho do conjunto de dados de entrada, somente dos hiperparâmetros usados. Além disso, as performances em relação a métrica AUPRC ficaram próximas na maioria dos conjuntos comparando HyperFast com os outros algoritmos. Já o modelo XGBoost superou os outros algoritmos em relação ao tempo com as métricas melhores em todos conjuntos. |