Processamento de arquivos de áudio para composição de testes de reconhecimento de fala em português

DSpace Repository

A- A A+

Processamento de arquivos de áudio para composição de testes de reconhecimento de fala em português

Show simple item record

dc.contributor Universidade Federal de Santa Catarina. pt_BR
dc.contributor.advisor Paul, Stephan
dc.contributor.author Knappmann, Kauana
dc.date.accessioned 2024-12-18T17:18:56Z
dc.date.available 2024-12-18T17:18:56Z
dc.date.issued 2024-12-12
dc.identifier.uri https://repositorio.ufsc.br/handle/123456789/262102
dc.description TCC (graduação) - Universidade Federal de Santa Catarina, Centro de Ciências da Saúde, Fonoaudiologia. pt_BR
dc.description.abstract Introdução: Testes de reconhecimento de fala são instrumentos relevantes para a avaliação audiológica de portadores de perda auditiva. A criação de testes de reconhecimento de fala em português é incipiente, parcialmente devido à escassez de recursos para tal. Objetivo: Desenvolver códigos computacionais para modificação automatizada de grandes quantidades de gravações de sentenças, que possam realizar modificações de formato, filtragens, simular o processamento dos sinais sonoros em implantes cocleares e ajustar as médias quadráticas de amplitude para equalizar o volume sonoro percebido entre sentenças. Metodologia: Para os diferentes processamentos pretendidos foram desenvolvidos códigos em Python, usando as interfaces Spyder e pacotes tais como o pydub, soundfile, os e numpy. Os códigos foram testados em dois conjuntos de arquivos de áudio gravados previamente em português brasileiros, no formato de .MP3 e .WAV. Resultados: Foram implementados códigos para 1) modificação do formato do arquivo, 2) ajuste do fade-in e fade-out, 3) filtragem de passa-alta, 4) vocoderização opcional e 5) ajuste das médias quadráticas das amplitudes. Os testes dos códigos desenvolvidos em dois conjuntos de sentenças disponíveis em .WAV e .MP3 na língua portuguesa demonstraram resultados consistentes com o esperado. Conclusão: Desenvolveu-se códigos na linguagem Python para modificação de maneira automatizada de arquivos de áudio, disponíveis no site GitHub para adaptações e aprimoramentos por terceiros. pt_BR
dc.description.abstract Introduction: Speech recognition tests are relevant tools for the audiological evaluation of individuals with hearing loss. The development of speech recognition tests in Portuguese is still in its early stages, partly due to the lack of resources for such endeavors. Objective: To develop computational codes for the automated modification of large quantities of sentence recordings, capable of performing format modifications, filtering, simulating sound signal processing in cochlear implants, and adjusting root mean square amplitude to equalize perceived volume between sentences. Methodology: Python codes were developed for the intended processes, using the Spyder interface and packages such as pydub, soundfile, os, and numpy. The codes were tested on two sets of previously recorded audio files in Brazilian Portuguese, in .MP3 and .WAV formats. Results: Codes were implemented for 1) file format modification, 2) fade-in and fade-out adjustment, 3) high-pass filtering, 4) optional vocoderization, and 5) adjustment of root mean square amplitude. Testing the developed codes on two sets of sentence recordings available in .WAV and .MP3 formats in Portuguese showed consistent results as expected. Conclusion: Python codes were developed for the automated modification of audio files, available on the GitHub website for further adaptations and improvements by third parties. pt_BR
dc.format.extent 24 f. pt_BR
dc.language.iso por pt_BR
dc.publisher Florianópolis, SC. pt_BR
dc.rights Open Access. en
dc.subject Audiologia pt_BR
dc.subject Processamento de Sinais Assistido por Computador pt_BR
dc.subject Testes Auditivos pt_BR
dc.subject Audiology pt_BR
dc.subject Signal Processing pt_BR
dc.subject Computer-Assisted pt_BR
dc.subject Hearing Tests pt_BR
dc.title Processamento de arquivos de áudio para composição de testes de reconhecimento de fala em português pt_BR
dc.type Article pt_BR


Files in this item

Files Size Format View Description
TCC.pdf 985.3Kb PDF View/Open TCC
ATA_Defesa_Step ... ado_assinado_assinado .pdf 309.6Kb PDF View/Open Ata da Defesa

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

Compartilhar