Agrupamiento en grafos bipartitos y optimización de parámetros basada en enjambre de partículas, aplicación en la detección de genes ortólogos

dc.contributor.advisorGalpert Cañizares, Deborah Raquel
dc.contributor.authorMontes de Oca Labrada, Maray
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2018-03-24T22:31:08Z
dc.date.available2018-03-24T22:31:08Z
dc.date.issued2011-07-06
dc.description.abstractEl presente trabajo es una continuidad del trabajo de diploma “Herramientas Computacionales de Comparación de Genomas” donde se construía un grafo bipartito completo a partir de la medida de similaridad local-global entre genes y se implementaba un agrupamiento BUS sobre este grafo para detectar genes ortólogos. En el presente trabajo se realiza un estudio de diferentes técnicas de agrupamiento y co-agrupamiento sobre grafos bipartitos y se aplica la implementación del algoritmo de particionamiento multinivel METIS a la fase de agrupamiento del algoritmo de detección de ortólogos. Inicialmente se realiza una poda por umbral a la matriz del grafo bipartito completo formado para la comparación de los genomas S.Cerevisiae y S.pombe. Luego se aplica el METIS a la matriz podada y sus resultados de agrupamiento se comparan con la base de datos de ortólogos para estas dos especies curada manualmente en el Laboratorio Sanger. Esta comparación se realiza mediante el cálculo de la medida Indice Ajustado de Rand obteniéndose mejores valores que los obtenidos con el algoritmo BUS. La implementación de estos procedimientos se realizó en Matlab 9.0 con el uso del paquete LINKCLUE disponible en Internet. Con vistas a mejorar la precisión de la detección de ortólogos, se realiza primeramente una estimación de los parámetros para el umbral de la poda minimizando la distancia de Hamming entre la matriz podada y la matriz formada a partir de los resultados de agrupamiento de Sanger. Este procedimiento se realizó en MATLAB implementando la metaheurística bioinspirada en enjambres de partículas PSO. Los resultados obtenidos muestran que elvalor más adecuado para la poda es 80. Seguidamente, se realiza otro proceso de estimación del parámetro de cantidad de grupos iniciales a formar por el METIS, optimizando el Indice Ajustado de Rand en comparación con la base de datos Sanger. Para esto se implementó también el PSO en Matlab y se utilizó la mejor matriz podada en el paso previo. Finalmente, los resultados de calidad obtenidos en el agrupamiento superan los del algoritmo BUS.en_US
dc.description.abstractThis Project is a continuation of the Diploma Paper “Computational Tools for genome comparison” where the authors built a complete bipartite graph from a local-global gene similarity measure. They implemented a BUS clustering algorithm to this graph to detect the orthologs. In our project, we studied some clustering and biclustering techniques for bipartite graphs. We applied the available implementation of the multilevel partitioning algorithm METIS to the grouping phase of the ortholog detection algorithm. First, we run a threshold pruning process to the complete graph of the comparison of the S.Cerevisiae and S.pombe genomes. Next, we applied METIS on the pruned matrix and its results are compared with the ones in the manually curated SANGER database. This comparison was made through the Adjusted Rand Index measure (ARI) with better results than the ones obtained with BUS. The implementation of the procedures was made in Matlab 9.0 with the use the LINKCLUE available package for the ARI calculation. In order to improve the precision of the ortholog detection we first estimate the value of the prunning process minimizing the Hamming Distance between the pruned matrix and the binary matrix obtained from SANGER database. This process was based on the bio-inspired metaheuristic Particle Swarm Optimization (PSO). The best pruning parameter was 80. The pruned matrix built with this value was used in the next PSO step where we estimate the value of the number of clusters for the METIS algorithm maximizing the ARI measure in respect to SANGER. Both PSO implementations were made in Matlab. The maximum ARI obtained overdo the BUS ARI.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/9092
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectAgrupamientoen_US
dc.subjectGrafos Bipartitosen_US
dc.subjectOptimización de Parámetrosen_US
dc.subjectEnjambre de Partículasen_US
dc.subjectDetección de Genes Ortólogosen_US
dc.subjectMatlab 9.0en_US
dc.subjectPaquete LINKCLUEen_US
dc.subjectLaboratorio de Bioinformáticaen_US
dc.subjectUniversidad Central Marta Abreu de Las Villas (UCLV)en_US
dc.subject.otherAlgoritmos de Agrupamientoen_US
dc.subject.otherTécnicas de Agrupamientoen_US
dc.subject.otherGrafosen_US
dc.subject.otherMetaheurísticaen_US
dc.subject.otherOptimización por Enjambre de Partículasen_US
dc.subject.otherMétodos de Detecciónen_US
dc.subject.otherOrtologíaen_US
dc.subject.otherPaquete de Software Matlaben_US
dc.subject.otherBioinformáticaen_US
dc.subject.otherUniversidad Central Marta Abreu de Las Villasen_US
dc.titleAgrupamiento en grafos bipartitos y optimización de parámetros basada en enjambre de partículas, aplicación en la detección de genes ortólogosen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Maray Mostes de Oca.pdf
Tamaño:
1.26 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: