Herramientas computacionales para la comparación de genomas y detección de genes ortólogos con un enfoque de grafo bipartido

Fecha

2012-04-15

Autores

Fernández Marín, Miguel Ángel

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas. Facultad de Matemática, Física y Computación. Departamento de Computación

Resumen

En los estudios de comparación de genomas, específicamente el problema de la detección de genes ortólogos, se toman en cuenta las mutaciones de nucleótidos y los reordenamientos globales en los genomas. Los algoritmos consultados en la bibliografía que abordan este problema muestran aproximadamente un 90% de precisión siendo éste un problema latente. El presente trabajo plantea como objetivo diseñar una herramienta computacional para la detección de genes ortólogos, basado en el enfoque de grafos bipartidos, que combine, mediante el operador de agregación “Ordered Weighted Average operator” (OWA) y la media aritmética, rasgos como la homología de los genes, la longitud de las secuencias, la relación evolutiva según el modelo “The Five Model” (SG2009) y la pertenencia a regiones conservadas teniendo en cuenta los reordenamientos globales en los genomas y las mutaciones. La fase de agrupamiento del algoritmo implementa la técnica de particionamiento de grafos BUS, que incluye la búsqueda de bloques con un orden conservado, la eliminación de ambigüedades y la selección de los mejores subconjuntos uno a uno. Se tomó como referencia para validar la clasificación el algoritmo Inparanoid 7.0, aunque el mismo no se ha reportado con un 100% de exactitud en la clasificación. El algoritmo y la experimentación utilizando los genomas Saccharomyces Cervisiae y Schizosaccharomyces Pombe fueron implementados en Matlab 7.10.0. La validación muestra una coincidencia en la clasificación de un 85.24%. Palabras Claves: Genes ortólogos, alineamiento, reordenamientos globales en los genomas, precisión de algoritmos, segmentos conservados, grafo bipartido, particionamiento de grafo BUS.
In comparative genomic studies, specifically in the ortholog detection problem, nucleotides mutations and global genome rearrangements are taking into account. The ortholog detection algorithms consulted in literature show about a 90% of accuracy, hence, precision is a latent problem. The present work has the main goal of designing a computational tool for the detection of ortholog genes based on the bipartite graph approach to combine with the Ordered Weighted Average operator (OWA) and the arithmetic media, the homology of the genes, the length of the sequences, the evolutionary relationship under The Five Model (SG2009) and the membership to conserved regions considering global genome rearrangements and mutations. The clustering step implements the BUS partitioning technique that includes the building of the synteny blocks, the deletion of ambiguities and the selection of the best “one to one” subsets. The classification of the Inparanoid 7.0 algorithm was taken as a reference to validate the classification of the proposed algorithm, even though Inparanoid´s classification has not been reported with a 100% of accuracy. The algorithm and the experiments with Saccharomyces Cervisiae and Schizosaccharomyces Pombe genomes were implemented in Matlab 7.10.0. The validation process has shown 85.24% of coincidences. Keywords: Ortholog genes, alignment, global genome rearrangements, algorithm accuracy, conserved synteny, bipartite graphs, BUS graph partitioning.

Descripción

Palabras clave

Genomas, Genes Ortólogos, Grafos Bipartidos

Citación