Revisitando o Uso da Transformada de Fourier no Reconhecimento de Voz para Robótica Móvel

Título: Revisitando o Uso da Transformada de Fourier no Reconhecimento de Voz para Robótica Móvel

Autores: Igor R. Sousa, Jefferson C. Figueiredo and Guilherme A. Barreto.

Resumo:
Este trabalho trata do reconhecimento de comandos de voz para o acionamento de um robo móvel. Comandos básicos formados pela elocução das palavras avançar, direita, esquerda, parar e recuar são gravados por um usuário e utilizados para criação de um banco de arquivos de áudio. A partir dos áudios gravados, técnicas de extração de atributos de sinais de voz são usadas para gerar dois bancos de dados que servirão para treinamento e teste do modulo de reconhecimento de voz do software de controle do robo. Para isso, são usadas as clássicas técnicas de codificação linear preditiva (linear predictive coding, LPC) e transformada rapida de Fourier (fast Fourier transform, FFT). Em particular, a FFT e usada de um modo não usual, porém melhor adequada ao uso em sistemas embarcados. Além disso, diversas técnicas de pré-processamento são testadas sobre os atributos extraídos para avaliar possíveis impactos na acuracia dos classificadores avaliados (discriminante linear de mínimos quadrados e a rede perceptron multicamadas). A contribuição principal do estudo reside na obtenção de uma solução adequada para ser embarcada em um sistema robótico real.

Palavras-chave:
comando de voz, coeficientes LPC, transformada de Fourier, rede MLP, robô móvel.

Páginas: 8

Código DOI: 10.21528/CBIC2021-40

Artigo em pdf: CBIC_2021_paper_40.pdf

Arquivo BibTeX: CBIC_2021_40.bib