Cálculo de la importancia de Features y evaluación de la calidad de proteínas en el problema de discriminación de decoys.

Título: Cálculo de la importancia de Features y evaluación de la calidad de proteínas en el problema de discriminación de decoys.

Autores: Maldonado Távara, Edwin;M.B.R Vellasco, Marley;A.C. Horta, Bruno;L. Custodio, Fabio

Resumo:
En el cuerpo humano la función de las proteínas esta determinada por la estructura tridimensional, la estructura tridimensional puede ser predicha por métodos computacionales. Los métodos computacionales usados generan una gran cantidad de modelos candidatos(Decoys), para evaluar la calidad de estos existen dos tipos de métodos: (1)basados en la similaridad y (2) Aprendizaje de máquina(AM). El primer grupo es usado cuando la estructura nativa de la proteína es conocida (RMSD, TM-Score, Z-Score). El segundo tipo de métodos usan un sub conjunto de características fisicoquímicas. Estas características son seleccionadas manualmente para ser usadas en el modelo de AM. Haciendo esto se podría estar dejando de lado características sumamente relevantes para la evaluación de la calidad de los modelos candidatos(Decoys). El presente trabajo proporciona tres características de suma importancia: (1)Considera diferentes tipos de características simultáneamente; (2)Proporciona la importancia relativa de los diferentes tipos de características que intervienen en la evaluación de los Decoys; (3)El nuevo modelo, llamado Método Envolvente para Cálculo de la Importancia de Características (MECIC) también calcula la calidad de los modelos de proteína candidatos. Como muestran los resultados, estas tres características del modelo, lo convierten en una poderosa herramienta no solo para la predicción de la calidad de los Decoys sino que también brinda un mejor entendimiento de los factores a ser considerados en su evaluación.

Palavras-chave:
Método Envolvente para selección de Características;Cálculo de la importancia de Características;Aprendizaje de Máquina(AM);Discriminación de Decoys;Evaluación de la Calidad de Proteínas,Redes Neurales;Algoritmos Genéticos;Método Envolvente para Cálculo de la Importancia de Características (MECIC).

Páginas: 12

Código DOI: 10.21528/CBIC2017-123

Artigo em pdf: cbic-paper-123.pdf

Arquivo BibTeX: cbic-paper-123.bib