Estudio de simulación en la detección de genes ortólogos

Fecha

2012-07-03

Autores

Companioni Brito, Claudia

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

This simulation study analyses the behaviour of ortholog detection classifications taking into account the variation of substitution matrixes and of the gap penalty values in the alignment process. Two simulation models are defined in order to vary the alignment parameters. In the first one, both parameters are randomly selected and in the second one, the recommended VTML200 matrix is combined with random penalty values. The BLAST algorithm version 2.2.25 was used to obtain the most significant bit-scores that were compared with both of the simulation model results. The Best Unambiguous Subset algorithm was implemented to study the behaviour of the ortholog detection classification. On the other hand, the simulation implementation was distributed between MATLAB and Java to benefit from both of them. The simulation results were validated considering the adjusted Rand index with the Saccharomyces Cerevisiae and the Schizosaccharomyce Pombe genomes by using the INPARANOID 7.0 ortholog list. The statistic analysis was carried out with the SPSS package by means of horizontal comparison tests.
En el presente trabajo se propone un estudio de simulación para analizar el comportamiento de la clasificación de genes ortólogos a partir de la variación de las matrices de sustitución y valores penalización de gaps en el proceso de alineamiento de secuencias. Para variar los parámetros del alineamiento se definen dos modelos de simulación, el primero variando aleatoriamente los parámetros y el segundo empleando la matriz de sustitución VTML200 recomendada en la literatura. Se emplea el algoritmo BLAST en su versión 2.2.25 para obtener los “bit scores” de los alineamientos más significativos y luego compararlos con los resultados obtenidos por cada uno de los modelos de la simulación. Para estudiar el comportamiento de la clasificación de genes ortólogos se implementa el algoritmo basado en “Best Unambiguous Subsets” (BUS). La implementación de la simulación se distribuye entre MATLAB y Java, aprovechando las ventajas que brinda cada uno. Los resultados de la simulación se validan con los genomas de Saccharomyces Cerevisiae y el Schizosaccharomyce Pombe usando la lista de genes ortólogos obtenida por el algoritmo de INPARANOID 7.0, con la medida de validación externa el índice de Rand ajustado (ARI). Usando el SPSS se realiza un análisis estadístico de los resultados obtenidos a través de pruebas de comparación horizontal.

Descripción

Palabras clave

Pruebas de Comparación, Genes Ortólogos, Genes, Simulaciones, Matrices de Sustitución, Modelos de Simulación

Citación

Descargar Referencia Bibliográfica