Programación paralela de algoritmos básicos empleados en el análisis filogenético

dc.contributor.advisorChávez Cárdenas, María del Carmen
dc.contributor.advisorSánchez Rodríguez, Robersy
dc.contributor.authorMoreira Broche, Jorge Enrique
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2018-06-29T17:56:29Z
dc.date.available2018-06-29T17:56:29Z
dc.date.issued2010-06-29
dc.description.abstractLa existencia de grandes cantidades de información acerca de las secuencias genéticas de varias especies presenta un gran reto para la comunidad científica en su afán de extraer conocimientos de valor de las mismas. Las herramientas disponibles actualmente que permiten el análisis y comparación de estas secuencias, resultan ineficientes cuando se enfrentan a grandes volúmenes de datos debido al alto costo computacional asociado a la mayoría de los algoritmos que se utilizan con este fin. El pronóstico de nuevas mutaciones de influenza, que aborda el grupo de Bioinformática de la UCLV es un ejemplo de estos retos computacionales. Este trabajo propone una implementación paralela en C++ de los algoritmos básicos del análisis filogenético usando el paradigma de paso de mensajes, con el objetivo de lograr una disminución sustancial de sus tiempos de ejecución. Se realizó un análisis de complejidad computacional de los algoritmos mencionados y se aplicaron las técnicas de programación paralela en aquellas etapas en que resultó propicio hacerlo. La aplicación desarrollada fue puesta a prueba en un clúster de 6 computadoras y en una máquina con un procesador de 4 núcleos, comparando su desempeño con el de la implementación en Matlab ya existente y con el de otra implementación secuencial en C++. Para ello se utilizaron dos alineamientos de las secuencias de un gen del virus de la Influenza. Las pruebas realizadas permitieron comprobar la superioridad significativa de la implementación en paralelo frente a sus contrapartes secuenciales en el procesamiento de grandes cantidades de datos.en_US
dc.description.abstractThe existence of large amounts of information about the genetic sequences of several species presents a great challenge to the scientific community in its attempts to extract valuable knowledge from it. The available tools that currently allow the analysis and comparison of these sequences, behave inefficiently when faced to big volumes of data due to the high computational cost associated with most of the algorithms used with this purpose. The prediction of new mutations of influenza, which addresses the Bioinformatics Group at UCLV is an example of this computational challenges. This work proposes a parallel implementation in C++ of the basic algorithms of phylogenetical analysis using the message-passing paradigm, with the objective of a substantial decrease of its execution times. A computational complexity analysis of the above mentioned algorithms was made and parallel programming techniques were applied in those stages in which it resulted propitious. The developed application was tested in a 6 computers cluster and in a computer with a 4 cores processor, comparing its performance with that of the already existent Matlab implementation and another sequential implementation in C++. Two alignments of a gene of the Influenza virus were used with this purpose. The tests carried out proved the significant superiority of the parallel implementation when compared to its sequential counterparts in the processing of large amounts of data.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/9603
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectAnálisis Filogenéticoen_US
dc.subjectProgramación Paralelaen_US
dc.subjectBioinformáticaen_US
dc.subject.otherProgramación Paralelaen_US
dc.subject.otherAlgoritmosen_US
dc.subject.otherAnálisisen_US
dc.subject.otherFilogeniaen_US
dc.subject.otherBiologíaen_US
dc.subject.otherBioinformáticaen_US
dc.titleProgramación paralela de algoritmos básicos empleados en el análisis filogenéticoen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Tesis Jorge Moreira.pdf
Tamaño:
1.15 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: