Classifying atrial arrhythmias in electrocardiograms evaluating different deep learning techniques to find a simple well-performing approach

Repositório institucional da UFSC

A- A A+

Classifying atrial arrhythmias in electrocardiograms evaluating different deep learning techniques to find a simple well-performing approach

Mostrar registro completo

Título: Classifying atrial arrhythmias in electrocardiograms evaluating different deep learning techniques to find a simple well-performing approach
Autor: Perrin, Dominik Sandro
Resumo: Os problemas cardíacos como arritmias cardíacas representam uma das causas mais comuns de morte no mundo, arritmias cardíacas são originados em diferentes regiões do coração, apresentando, portanto, padrões muito específicos. O diagnóstico de doenças cardíacas é normalmente realizado por meio de eletrocardiogramas contando diferentes derivações. Esses exames são analisados por profissionais, entretanto, com o surgimento de melhores métodos de inteligência artificial, podemos observar um aumento nas tentativas de apoiar a análise com redes neurais. Existem várias abordagens utilizando tanto dados brutos quanto características desenvolvidas manualmente, como espectrogramas. As redes neurais mais populares são as redes neurais convolucionais que são frequentemente utilizadas como base, bem como as redes neurais recorrentes que também se mostram uma abordagem popular. A construção de um banco de dados para classificação é um desafio, por isso, utilizamos os dados do desafio Physionet 2021, composto por mais de 88.000 eletrocardiogramas disponíveis publicamente, provenientes de diversas fontes. O objetivo desta dissertação é apresentar uma visão geral e a fundamentação teórica dos conceitos mais importantes utilizados e necessários para a compreensão deste trabalho, bem como detalhar as configurações dos modelos, incluindo as estruturas ResNet e LSTMs, os diferentes hiperparâmetros e especificidades dos dados utilizados. Os resultados de diferentes modelos usando dados brutos ou espectrogramas e/ou LSTMs são descritos. O modelo com melhor desempenho é um ResNet34 baseado no uso de espectrogramas e 3 derivacoes, com uma exatidão total no teste de 78,48%, seguido por um ResNet34 que usa dados brutos e atinge 78,25%. Os modelos menores e mais simples baseados no ResNet18 também alcançaram acuracías muito altas, próximas aos modelos maiores. O melhor LSTM usando dados brutos alcançou apenas 56,91% no teste, com desempenho significativamente pior. Com base nas observações feitas, concluímos que um número menor de derivações já era suficiente e que os LSTMs não tiveram um bom desempenho, devido ao excesso de ajuste, mostrando as enormes vantagens dos modelos mais simples neste trabalho.Abstract: Cardiac arrhythmias and heart problems are among the most common causes of death worldwide, caused by various sicknesses in different heart regions and, therefore, having a pattern. The diagnosis of these diseases is commonly made with the help of electrocardiograms, which can include a different number of leads. Professionals usually analyze them; however, with the emergence of better artificial intelligence methods, there are more and more attempts to support the analysis with the help of deep neural networks. Various ideas exist for achieving that using raw data or handcrafted features such as spectrograms. For deep neural networks, convolutional neural networks are often used as a basis, and recurrent neural networks are a popular approach. Building an own database for classification is challenging, so for this work, the data of the Physionet 2021 challenge is used, consisting of over 88000 publicly available electrocardiograms with 12 leads from various sources. The overall goal of this dissertation is to create a well-performing, easy-to-use classifier for atrial arrhythmias. Therefore, an overview and theoretical background of the most important concepts being utilized is given needed to understand this work. Then, the model setups and configurations, including the ResNet Backbones and LSTM structures, are described, and the different hyperparameters and the specifics of the data are outlined. The results of different models using raw data or spectrograms and or LSTMs are given. The best-performing model is ResNet34 based, using Spectrograms and three leads having a full accuracy in the test of 78.48%, followed by a ResNet34 using raw data achieving 78.25 %. The smaller, simpler models based on ResNet18 also achieved very high accuracies close to the bigger models. The best LSTM using raw data only achieved 56.91 % in the test performed significantly worse. From the observations, we conclude that a smaller number of leads was already sufficient and that the LSTMs did not perform well, most likely due to overfitting showcasing the huge advantages of the simpler models in this work.
Descrição: Dissertação (mestrado profissional) - Universidade Federal de Santa Catarina, Centro de Ciências da Saúde, Programa de Pós-Graduação em Informática em Saúde, Florianópolis, 2021.
URI: https://repositorio.ufsc.br/handle/123456789/254722
Data: 2023


Arquivos deste item

Arquivos Tamanho Formato Visualização
PGIS0062-D.pdf 2.159Mb PDF Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro completo

Buscar DSpace


Navegar

Minha conta

Estatística

Compartilhar