Multi-Classificação de Cenários de Violência utilizando Extração de Atributos Acústicos e Redes Neurais Convolucionais

Título: Multi-Classificação de Cenários de Violência utilizando Extração de Atributos Acústicos e Redes Neurais Convolucionais

Autores: Caleo Meneses Santos, Antonio Carlos Lopes Fernandes Junior

Resumo: O presente trabalho aborda a necessidade urgente de desenvolver tecnologias que visem reduzir a incidencia de eventos violentos em nossa sociedade, particularmente no contexto brasileiro, onde populaçoes marginalizadas como jovens negros enfrentam temores constantes de violencia letal. Nesse contexto, a abordagem acustica surge como uma vertente promissora devido as suas vantagens intr ` ínsecas, como a capacidade de detecção automatizada e a não oclusão do ambiente. Este trabalho tem como objetivo principal contribuir para o problema da identificação de cen arios de violência treinando um modelo de aprendizado de máquina capaz de identificar e classificar cenários tais como gritos, violencia física e disparos de armas de fogo. Foram testadas arquiteturas de redes neurais convolucionais, em particular as redes ResNet152 e MobileNet. Os resultados demonstram que ambos os modelos alcançaram precisões similares na tarefa de multi-classificação, com precis oes de 84,9% e 84,1%, respectivamente. Esses achados destacam a viabilidade e eficacia da abordagem proposta, mostrando o potencial das redes neurais convolucionais na classificação de cen arios violentos utilizando apenas o audio.

Palavras-chave: Classificação sonora, An alise de cena acústica, Redes neurais convolucionais, Cenários violentos, Extração de atributos

Páginas: 8

Código DOI: 10.21528/CBIC2023-107

Artigo em pdf: CBIC_2023_paper107.pdf

Arquivo BibTeX: CBIC_2023_107.bib