Modelos de Aprendizado de Máquina Aplicados à Detecção de Câncer de Mama

Título: Modelos de Aprendizado de Máquina Aplicados à Detecção de Câncer de Mama

Autores: José de Deus E Silva Neto, André Oliveira Carvalho da Silva, Matheus Leão Campos, Wendler Luis Nogueira Matos and Orlando Fonseca Silva

Resumo:
O objetivo deste trabalho é construir um algoritmo classificador binário de câncer de mama, baseado em dados de exame de sangue e fisiológicos (Idade, Índice de Massa Corporal, Glicose, Insulina, Modelo de Avaliação da Homeostase, Leptina, Adiponectina, Resistina e Proteína Quimiotática de Monócitos-1) de 116 pacientes. Para tal estudo, realizou-se comparativo de desempenho dos seguintes modelos de aprendizado de máquina: Árvore de Decisão, Floresta Aleatória, K-Vizinhos mais Próximos, Redes Neurais Artificiais, Máquinas de Vetores de Suporte e Regressão Logística. Quanto a metodologia aplicada nos dados, teve-se duas: validação cruzada por k-fold (k=10); divisão dos dados em 80% treino e 20% teste. Para a primeira, avaliou-se média da acurácia e da sensibilidade. Na segunda, valores de acurácia, sensibilidade, especificidade e área sob a curva da característica de operação do receptor. Além disso, a partir do valor-p, por correlação de Pearson e Spearman, dependendo da variável de entrada, realizou-se o teste apenas com as variáveis com nível de significância de 5%, que foram: Glicose, Insulina, Resistina e Modelo de Avaliação da Homeostase. Como melhor classificador final, teve-se a Floresta Aleatória, no método treino/teste e com 9 variáveis, com 83,3% de acurácia, 100% de sensibilidade, 64% de especificidade e 0,881 de área sob a curva.

Palavras-chave:
Câncer de Mama, Classificação, Modelos de Aprendizado de Máquina..

Páginas: 7

Código DOI: 10.21528/CBIC2021-154

Artigo em pdf: CBIC_2021_paper_154.pdf

Arquivo BibTeX: CBIC_2021_154.bib