Comparación de metaheurísticas aplicadas a la predicción de la estructura terciaria de proteínas

Fecha

2016-11-15

Autores

Martínez Pérez, Elizabeth

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas. Facultad de Matemática, Física y Computación. Departamento de Ciencias de la Computación

Resumen

La predicción experimental de la estructura terciaria de una proteína es una tarea compleja, que implica considerables costos en tiempo y tecnología, además el número de secuencias conocidas y almacenadas en bases de datos como Genbank ha aumentado constantemente durante los últimos 15 años sin un incremento similar en el número de estructuras 3D elucidadas. En consecuencia, la búsqueda de métodos computacionales de predicción estructural ha sido uno de los campos más activos en Biología y Química Computacional. Algunos de los métodos utilizados emplean metaheurísticas como algoritmos de optimización, sin embargo no se describen en la literatura estudios comparativos de su desempeño en una misma base de casos. Siendo por consiguiente el objetivo principal de la tesis: evaluar el desempeño de tres metaheurísticas: Optimización basada en Mallas Variables (VMO), Algoritmos Genéticos (GA) y Recocido Simulado (SA). Estos algoritmos fueron implementados en un software de fácil uso. Con una base de casos de 26 proteínas [100-300 aminoácidos], se comparan las metaheurísticas respecto a la calidad de las soluciones y desempeño computacional, donde GA es seleccionada como la mejor metaheurística. GA respecto a predictores internacionales, en promedio, logra ubicarse en por encima del 50% de los predictores en el 33.66% de las proteínas. La mejor solución de GA logra ubicarse en por encima del 50% de las predicciones en el 70% de las proteínas. GA permite obtener soluciones, que en promedio, superan el 50% de las predicciones de contemporáneos en la métrica GDT (calculada en el servidor LGA).
Experimental prediction of the tertiary structure of a protein is a complex task, which involves considerable costs in time and technology, besides the number of known sequences in databases like Genbank has grown increasingly over the past fifteen years, without the same increment in elucidated 3D structures. Hence the search for computational structural prediction methods has been one of the most active fields in Biology and Computational Chemistry. Some methods have used metaheuristics as optimization algorithms; however it has not been described in the literature any comparative studies of their performances in a given data set. It is therefore the objective of this thesis: to evaluate the performance of three metaheuristics: Variable Mesh Optimization (VMO), Genetic Algorithms (GA) and Simulated Annealing (SA). These algorithms were implemented in single user-friendly software. A data set of 26 proteins [with 100 to 300 amino acids each] was selected for conducting the experiments. The metaheuristics were assessed according the quality of the solutions and computational performance, the results show that GA compares favorably with the other two algorithms. The GA was ranked with international predictors resulting, on average, over 50% of them in 33.66% of the proteins. The best solution of GA was positioned over 50% of all the predictions in 70% of proteins. GA allows obtaining solutions, on average, over 50% of the solutions of contemporary predictors, according GDT metric (calculated on LGA server).

Descripción

Palabras clave

Proteínas, Mallas Variables, Algoritmos Genéticos, Metaheurísticas

Citación