Herramientas computacionales para la comparación de genomas

Fecha

2009-07-03

Autores

Estopiñales Blay, Michel

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

En la comparación de genomas y la detección de genes ortólogos se estudian las mutaciones de nucleótidos y los reordenamientos de genes. Los algoritmos consultados muestran más 90% de precisión siendo éste un problema latente. Este trabajo incorpora el reordenamiento a la comparación de dos genomas de especies cercanas en la evolución mediante el uso del Mauve. Este encuentra segmentos conservados que aparentan no haber sido alterados por el reordenamiento (LCB). Para comparar genes en cuanto a la pertenencia a LCB, la similitud de las secuencias y la longitud de las secuencias definimos una distancia por cada uno de los tres rasgos y una distancia global. El grafo bipartido construido a partir de la distancia global es podado eliminando aristas de salida que a lo sumo su peso sea un 20% mayor que el menor peso de las aristas de salida de un nodo. Luego se mantienen aristas que conectan genes cercanos a los bloques de orden conservado. Se obtienen los mejores subconjuntos sin ambigüedades (BUS) que representan los grupos de homología y los de dos nodos son los ortólogos. El algoritmo y la experimentación con S.Cervisiae y S.Bayanus fueron implementados en Matlab7.0a. La validación muestra un 98.45% de genes correctamente incorporados a grupos de homología.
Mutations and genome rearrangements has been studied in genome comparison and ortholog detection. Precision is an important issue for algorithms even with more than 90% of scores. Using Mauve software, our algorithm incorporates rearrangements to the comparison of two closely related species. Mauve identifies conserved segments that appear to be internally free from genome rearrangements (LCB). In order to compare genes we define a LCB membership distance, a sequence similarity distance, a length of sequence distance as local distances and a global distance. The bipartite graph constructed using the global distance is pruned eliminating outgoing-edges with weight at most 20% greater than the less weight of the outgoing-edges of a node. Then, we keep edges in the graph that are close the synteny blocks previously calculated. We obtain best unambiguous subsets without ambiguities (BUS) representing the homology groups. Two element groups are considered orthologs. The algorithm and the experiment with S. Cervisiae and S. Bayanus were implemented in Matlab7.0a. Validation shows a 98.45% of the genes correctly assigned to homology groups.

Descripción

Palabras clave

Comparación de Genomas, Detección de Ortólogos, Grupos de Homología, Herramientas Computacionales, Mauve, MatLab7

Citación

Descargar Referencia Bibliográfica