Aprendizado por imitação com multimodalidade de ações para navegação de veículos autônomos

DSpace Repository

A- A A+

Aprendizado por imitação com multimodalidade de ações para navegação de veículos autônomos

Show full item record

Title: Aprendizado por imitação com multimodalidade de ações para navegação de veículos autônomos
Author: Machado, Brenda S.
Abstract: Este trabalho investigou o uso de técnicas de aprendizado por imitação aplicadas à navegação de veículos autônomos, com foco em cenários de multimodalidade de ações, nos quais diferentes comportamentos podem ser válidos para uma mesma situação. Foram comparadas duas abordagens principais: o Behavior Cloning (BC), técnica explícita baseada em aprendizado supervisionado, e o Implicit Behavior Cloning (IBC), que utiliza modelos baseados em energia, Energy-Based Models (EBMs), para representar distribuições multimodais de ações e capturar incertezas nas decisões. A metodologia envolveu experimentos em dois ambientes de simulação: o CarRacing-v0, que fornece pistas simplificadas, e o CARLA, simulador urbano realista amplamente utilizado na pesquisa em direção autônoma. No CarRacing, foram coletadas trajetórias de demonstrações humanas para treinamento de redes neurais convolucionais, tanto na forma tradicional (BC) quanto adaptadas aos modelos de energia (IBC). No CARLA, foram empregadas representações bird’s-eye view (BEV), além de variáveis de estado, para treinar arquiteturas de redes neurais específicas para cada abordagem. A inferência do IBC foi realizada com otimização livre de derivadas (DFO), visando explorar diferentes modalidades de ação. Os resultados mostraram que o BC apresentou desempenho mais consistente, alcançando recompensas médias superiores no CarRacing, em torno de 400 pontos contra valores negativos do IBC, e métricas mais elevadas no CARLA, score médio de 867 contra 338. Por outro lado, o IBC demonstrou potencial promissor, principalmente pela capacidade de modelar paisagens de energia estruturadas e representar cenários multimodais, como conversões diferentes em cruzamentos. Observou-se que, ao longo do treinamento, o IBC passou a organizar melhor a função de energia, refletindo maior confiança nas ações inferidas, ainda que sem ganhos práticos significativos frente ao BC. Conclui-se que, embora o IBC não tenha superado o BC em métricas de desempenho, sua capacidade de lidar com multimodalidade de ações o torna uma abordagem relevante para cenários mais complexos da direção autônoma. Os resultados ainda confirmam tendências observadas na literatura, indicando que a principal limitação atual do IBC está na tradução de suas vantagens teóricas em ganhos efetivos de performance.
URI: https://repositorio.ufsc.br/handle/123456789/268076
Date: 2025-09-07


Files in this item

Files Size Format View Description
35_SIC_Brenda_Machado.mp4 9.043Mb MPEG-4 video View/Open Vídeo de apresentação da pesquisa PIBIC para o SIC 2025

This item appears in the following Collection(s)

Show full item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

Compartilhar