Título: Clonagem da Voz Humana por Síntese de Voz com uso de Inteligência Artificial
Autores: Alessander Alves Novaes, Luiz Alberto Pinto
Resumo: Esta pesquisa aborda a síntese de fala para reprodução de vozes em alta qualidade e tempo real no idioma portugues brasileiro. Nosso objetivo é atender a demanda do ` mercado publicitario por locuções, narrações e dublagens utilizando vozes geradas por modelos de Inteligência Artificial (IA). O modelo e treinado em dados de pares texto-fala e usa um mecanismo de atenção para alinhar o texto a fala gerada. Além disso, propomos uma estimativa automatica dos par ametros de um sintetizador por formantes, usando algoritmo genetico (AG), para imitar vozes. Com base nos resultados, alcançamos uma alta similaridade entre as vozes sinteticas e originais, validada por uma medida de similaridade de coseno de 0,90473765. Isso evidencia a qualidade da síntese realizada e reforça nosso foco em produzir vozes sinteticas semelhantes as vozes-alvo
Palavras-chave: synthetic speech, Tacotron2 model, neural networks, genetic algorithm, speech synthesis
Páginas: 8
Código DOI: 10.21528/CBIC2023-113
Artigo em pdf: CBIC_2023_paper113.pdf
Arquivo BibTeX: CBIC_2023_113.bib