Título: Otimização Bio-inspirada Utilizando Enxame de Partículas com Aplicação em Reconhecimento de Voz
Autores: Beserra, Amanda Abelardo Viana; Serra, Ginalber L. O.; Silva, Washington Luís Santos
Resumo: Este artigo propõe a otimização não linear de um Classificador de Padrões para Reconhecimento de Voz utilizando a técnica de Enxame de Partículas. O Classificador utiliza um sistema de inferência fuzzy para realizar a decisão do reconhecimento. O pré-processamento do sinal de voz incia-se com a retirada do silêncio com o algoritmo de taxa de cruzamento por zero e energia média deslizante e alinha-se temporalmente os sinais de voz utilizando-se a ‘Dynamic Time Warping’. Em seguida calcula-se os coeficientes mel-cepstrais. Após o pré-processamento utiliza-se a Transformada Cosseno Discreta (TCD) para gerar uma matriz temporal bidimensional. Essa matriz será utilizada como entrada do sistema de implicação fuzzy para gerar os padrões das palavras a serem reconhecidas. Finalmente são mostrados os resultados experimentais obtidos no processo de otimização para o reconhecimento de voz aplicado ao idioma português brasileiro.
Palavras-chave: Sistemas Fuzzy; Enxame de Partículas; Transformada Cosseno Discreta; Reconhecimento de Voz
Páginas: 6
Código DOI: 10.21528/CBIC2013-080
Artigo em pdf: bricsccicbic2013_submission_80.pdf
Arquivo BibTex: bricsccicbic2013_submission_80.bib