Clonagem da Voz Humana por Síntese de Voz com uso de Inteligência Artificial

Título: Clonagem da Voz Humana por Síntese de Voz com uso de Inteligência Artificial

Autores: Alessander Alves Novaes, Luiz Alberto Pinto

Resumo: Esta pesquisa aborda a síntese de fala para reprodução de vozes em alta qualidade e tempo real no idioma portugues brasileiro. Nosso objetivo é atender a demanda do ` mercado publicitario por locuções, narrações e dublagens utilizando vozes geradas por modelos de Inteligência Artificial (IA). O modelo e treinado em dados de pares texto-fala e usa um mecanismo de atenção para alinhar o texto a fala gerada. Além disso, propomos uma estimativa automatica dos par ametros de um sintetizador por formantes, usando algoritmo genetico (AG), para imitar vozes. Com base nos resultados, alcançamos uma alta similaridade entre as vozes sinteticas e originais, validada por uma medida de similaridade de coseno de 0,90473765. Isso evidencia a qualidade da síntese realizada e reforça nosso foco em produzir vozes sinteticas semelhantes as vozes-alvo

Palavras-chave: synthetic speech, Tacotron2 model, neural networks, genetic algorithm, speech synthesis

Páginas: 8

Código DOI: 10.21528/CBIC2023-113

Artigo em pdf: CBIC_2023_paper113.pdf

Arquivo BibTeX: CBIC_2023_113.bib