Proposta e Análise de Arquiteturas de Redes Neurais Convolucionais para Melhoria da Qualidade de Vídeos Comprimidos
Author:
Rohde, Pedro Machado Santos
Abstract:
A compressão de vídeos explora as redundâncias interquadros (temporais) e intraquadros (espaciais) para reduzir a quantidade de informação e desta forma, viabilizar o armazenamento e a transmissão dos vídeos. Porém, o contínuo aumento das resoluções dos vídeos mantém a demanda por novos algoritmos capazes de proporcionar taxas de compressão de bits cada vez mais altas, sem comprometer a qualidade da imagem.
Recentemente, alguns trabalhos têm proposto o uso de redes neurais convolucionais (CNNs) -- ferramentas poderosas em processamento de imagem -- como uma alternativa ao modelo híbrido de compressão, adotado pelos padrões de compressão atuais.
Nesse contexto, este trabalho de iniciação científica apresentou uma arquitetura de CNN para a interpolação temporal de quadros de vídeos, e investigou a possibilidade de estimação de fluxo óptico usando uma rede neural de baixa complexidade, a adequação da métrica MS-SSIM como função de custo para o treinamento, e o interesse em se realizar a interpolação temporal em baixa resolução espacial.
Os resultados obtidos foram validados em vídeos do dataset Vimeo-90K (XUE et al., 2019), construído especificamente para esse tipo de problema. As conclusões deste trabalho servem de base para a continuidade da pesquisa na direção de novas alternativas para a compressão de vídeo.
Description:
Seminário de Iniciação Científica e Tecnológica - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia Eletrônica.