Abstract:
|
Essa dissertação investiga a aplicação de técnicas de aprendizagem por reforço, mais precisamente o uso do algoritmo Q-learning distribuÌdo, como uma nova ferramenta de controle para o trafego veicular urbano a custos menos onerosos que os apresentados pelos métodos de controle de trafego responsivo e adaptativo, que necessitam de dispositivos complexos, além da dependencia de especialistas para operá-los. Visando melhorar o desempenho das redes de trafego, esse trabalho sugere o desenvolvimento e implementaçao de agentes inteligentes distribuÌdos como uma forma de controlar o fluxo da via, sendo a tarefa modelada como um jogo estocastico, onde multiplos agentes distribuÌdos sobre a rede, cada um com uma visão parcial do estado da mesma buscam resolver os seus problemas locais, dando |