Predição de acidentes rodoviários em Santa Catarina: o papel do enriquecimento de dados no desempenho dos modelos

DSpace Repository

A- A A+

Predição de acidentes rodoviários em Santa Catarina: o papel do enriquecimento de dados no desempenho dos modelos

Show full item record

Title: Predição de acidentes rodoviários em Santa Catarina: o papel do enriquecimento de dados no desempenho dos modelos
Author: Führ, Gustavo Konescki
Abstract: Os acidentes rodoviários representam um grande problema tanto para a segurança quanto para a economia, especialmente em Santa Catarina, que está entre os estados com maior número de ocorrências no Brasil. Diante disso, este trabalho tem como objetivo desenvolver um modelo de inteligência artificial capaz de prever acidentes rodoviários em Santa Catarina, avaliando o impacto do pré-processamento e do enriquecimento dos dados no desempenho dos modelos. A tarefa foi tratada como uma classificação binária, em que se busca identificar a ocorrência ou não de acidentes em trechos de 100 metros e intervalos de horas. Neste estudo, foram coletados dados sobre acidentes registrados pela Polícia Rodoviária Federal (PRF) no trecho entre os quilômetros 100 e 239 da BR-101 em SC, abrangendo 2017 a 2024. A pesquisa incluiu uma revisão bibliográfica focalizada em modelos de predição de acidentes, o que permitiu a identificação de novas fontes de dados e domínios de atributos comuns em outras análises. Foi realizado uma análise exploratória para cada conjunto de dados afim de entender seu conteúdo e detectar possíveis erros. Na análise, constatou-se que 74,15\% dos acidentes no mesmo intervalo de 100 metros possuíam pelo menos uma discrepância nos atributos da via, sugerindo inconsistências nos dados da PRF. O enriquecimento dos dados ocorreu de forma sequencial, integrando novos atributos em cada etapa. Assim, foram criados cinco conjuntos de dados distintos para o treinamento de modelos, começando com os dados brutos da PRF e terminando na versão mais enriquecida. O primeiro, PRF, utiliza os dados brutos de acidentes registrados. Em seguida, PRF/ANTT corresponde à base corrigida, com ajustes nas inconsistências. A terceira versão, PRF/ANTT+, trouxe informações adicionais de atributos da via. PRF/ANTT+/OPENMETEO, foram adicionados dados meteorológicos. Por fim, PRF/ANTT+/OPENMETEO/DNIT incorporou dados de tráfego, formando o conjunto mais completo. Foram treinados três tipos de modelos de aprendizado de máquina: Random Forest (RF), Support Vector Machine (SVM) e Multilayer Perceptron (MLP), para cada um dos cinco conjuntos. Os resultados mostraram que a correção das inconsistências nos dados foi a etapa que mais impactou positivamente o desempenho, com melhorias em todas as métricas. Por exemplo, a sensibilidade dos modelos RF, SVM e MLP aumentaram em 5\%, 7\% e 5\%, respectivamente. enquanto a adição de novos atributos produziu ganhos mais modestos, dependendo do modelo. Como os acidentes se concentram em determinados trechos da rodovia, o atributo quilômetro acabou se tornando dominante nos modelos, e por isso os experimentos foram repetidos sem essa variável para avaliar o impacto real dos novos dados. Essa modificação ocasionou uma queda geral de desempenho, evidenciando a importância do quilômetro para o trecho estudado, embora este padrão possa não se repetir em outras regiões. Ainda assim, observou-se que a incorporação de novos atributos da via elevou a sensibilidade dos modelos RF, SVM e MLP em 2\%, 4\% e 3\%, respectivamente.
Description: TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.
URI: https://repositorio.ufsc.br/handle/123456789/270742
Date: 2025-12-02


Files in this item

Files Size Format View
main2.pdf 4.550Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar