Título: Aprendizagem Não-Supervisionada Aplicada à Estratificação de Risco de Nascimentos Prematuros no Brasil com Recorte em Dados Socioeconômicos
Autores: Márcio Lopes Jr., Raquel Barbosa and Marcelo Fernandes
Resumo:
O nascimento prematuro (Preterm birth – PTB) é um fenômeno que traz diversos riscos e desafios à sobrevivência dos recém-nascidos. Apesar de muitos avanços, ainda não foram esclarecidas todas as causas desse fenômeno. Entende-se que o risco ao PTB é multi-fatorial e também pode estar associado a fatores socioeconômicos. Assim, este artigo tem como meta a utilização de técnicas de aprendizagem não-supervisionada para obter um estrato de risco de PTB no Brasil com a partir de dados socioeconômicos. Através de utilização de bancos de dados públicos disponibilizados pelo Governo Federal do Brasil, foi gerado um dataset a nível municipal com informações socioeconômicas e uma taxa de ocorrência de prematuridade. Este dataset foi clusterizado utilizando várias abordagens e técnicas de aprendizagem de máquina não-supervisionada como $k$-means, principal component analysis (PCA) e density-based spatial clustering of applications with noise (DBSCAN) . Após a validação, foram descobertos 4 clusters com ocorrências de PTB muito acima da média nacional, e 3 muito abaixo. Os clusters de alta prematuridade apontaram para municípios de menor nível educacional, de pior qualidade de serviços públicos, como saneamento e coleta de lixo, e de população menos branca. Foi observado ainda o aspecto regional, com os municípios em clusters de maior risco ao PTB estando localizados principalmente nas regiões Norte e Nordeste. Os resultados apontam para uma influência positiva da qualidade de vida e da oferta de serviços públicos na diminuição da ocorrência de nascimentos prematuros.
Palavras-chave:
Parto prematuro, Clusterização, Aprendizagem Não-Supervisionada, SINASC, Cadastro Único.
Páginas: 8
Código DOI: 10.21528/CBIC2021-136
Artigo em pdf: CBIC_2021_paper_136.pdf
Arquivo BibTeX: CBIC_2021_136.bib