Aprendizagem Profunda Aplicada à Classificação do SARS-CoV-2

Título: Aprendizagem Profunda Aplicada à Classificação do SARS-CoV-2

Autores: Karolayne Azevedo, Raquel Barbosa and Marcelo Fernandes.

Resumo:
Este artigo propõe uma técnica, baseada em aprendizado de máquina, que faz uso de uma rede neural convolucional (Convolutional Neural Network – CNN) profunda de uma dimensão (1D), destinada à classificação de genomas virais, capaz de identificar corretamente o vírus SARS-CoV-2, causador da doença COVID-19. Como entrada, foi utilizado amostras genômicas completas de DNAc (DNA complementar) do vírus da família Coronaviridae, extraídas a partir do repositório 2019 Novel Coronavirus Resource (2019nCoVR). A base de dados utilizada neste trabalho, contém 17.893 amostras de DNAc, cujo tamanho varia entre 26.342 bp e 31.029 bp (base-pair – bp). Ao contrário da maioria das abordagens apresentadas na literatura, os resultados obtidos por esta técnica, revelam valores máximos de precisão, sensibilidade, especificidade e F1-score, aplicados numa validação cruzada quíntupla, usada para avaliar o modelo. Os resultados obtidos, mostram-se mais confiáveis se comparados com os trabalhos discutidos no estado da arte, indicando que a ferramenta pode ser aplicada para a classificação de vírus da família Coronaviridae.

Palavras-chave:
SARS-CoV-2, COVID-19, Classificação viral, Aprendizagem profunda.

Páginas: 8

Código DOI: 10.21528/CBIC2021-75

Artigo em pdf: CBIC_2021_paper_75.pdf

Arquivo BibTeX: CBIC_2021_75.bib