Procedimiento de extracción de rasgos 3D-proteicos basado en Álgebra Lineal: Aplicaciones en estudios bioinformáticos
Fecha
2016
Autores
Contreras Torres, Ernesto
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central “Marta Abreu” de Las Villas
Resumen
En el presente trabajo, se propone un nuevo procedimiento para la extracción de rasgos tridimensionales (3D) proteicos basado en las formas algebraicas 2-lineales utilizando la kth matriz multi-métrica bidimensional de similitud-disimilitud para codificar información relativa a las interacciones no covalentes de estos biopolímeros. Se proponen además esquemas de generalización para el cálculo de las distancias inter-atómicas mediante el empleo de varias métricas. Se usaron las matrices simple-estocástica y de probabilidad mutua para normalizar la matriz multi-métrica bidimensional de similitud-disimilitud no estocástica. Asimismo, se generaliza la obtención de índices totales y locales por medio de varios operadores de agregación. Con el objetivo de discriminar entre las diferentes interacciones no covalentes entre las cadenas laterales de los aminoácidos, se definen procedimientos de cortes macromoleculares geométricos y topológicos. Además, se desarrolló un software denominado ToMoCoMD-CAMPS MuLiMs-MCoMPAs que automatiza el cálculo de los descriptores propuestos. Se realizaron estudios de variabilidad basado en entropía de Shannon y análisis de componentes principales. Adicionalmente, se creó una métrica denominada Entropía Promedio de Shannon Estandarizada y una nueva representación gráfica, de utilidad en los análisis de variabilidad. Además, los descriptores propuestos se aplicaron satisfactoriamente en la clasificación estructural de proteínas, así como en la predicción de la velocidad de plegamiento de cadenas polipeptídicas. En ambos estudios se obtuvieron modelos robustos y de buena capacidad predictiva. Finalmente, se anticipa la potencial aplicación de los descriptores propuestos en la modelación de otras propiedades biológicas y/o funciones de interés en ciencia de proteínas.
Descripción
Palabras clave
Descriptor 3D Proteico, Formas Algebraicas, Matriz Milimétrica de Similitud Disimilitud, Métricas, Operadores de Agregación