Evaluación de algoritmos de detección de ortólogos basados en conjuntos aproximados en levaduras Saccharomycete
Archivos
Fecha
2014-07-06
Autores
Sol Fong, Silvio Alexis
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central “Marta Abreu” de Las Villas
Resumen
En el presente trabajo se aborda la evaluación de algoritmos de clasificación de genes ortólogos basados en conjuntos aproximados en la familia levaduras Saccharomycete, donde la duplicación completa de genomas ocasionó pérdidas de genes con fallas potenciales para los algoritmos tradicionales. Se especifican algoritmos de detección basados en los conjuntos aproximados y su metodología de evaluación en la familia de genomas objeto de estudio, tratando el problema del desbalance en el conjunto de datos. Se diseñan, implementan y aplican algoritmos para la conformación de los conjuntos de datos usados por los algoritmos de clasificación, y para la evaluación de los mismos. La implementación de los algoritmos se realiza en el lenguaje de programación Java, aprovechando las ventajas que brinda este. Los resultados se validan usando la lista de genes ortólogos contenida en el fichero de referencia “Gold” obtenido de la base de datos YGOB. Los resultados se comparan con resultados obtenidos de estudios anteriores.
This thesis paper studies the evaluation of different rough sets based ortholog detection algorithms in the family of Saccharomycete yeasts, in which whole genome duplication lead to the loss of genes, carrying potentially fails to traditional algorithms. Rough sets based ortholog detection algorithms and their evaluation methodologies are described in detail, including the management of the data set imbalance problem. Data sets conformation and evaluation algorithms were designed, implemented and executed. All programs were programmed in Java, benefiting from its advantages. Results are validated by comparing their results against reference orthogroups retrieved from the YGOB database. Results were compared with previous studies.
This thesis paper studies the evaluation of different rough sets based ortholog detection algorithms in the family of Saccharomycete yeasts, in which whole genome duplication lead to the loss of genes, carrying potentially fails to traditional algorithms. Rough sets based ortholog detection algorithms and their evaluation methodologies are described in detail, including the management of the data set imbalance problem. Data sets conformation and evaluation algorithms were designed, implemented and executed. All programs were programmed in Java, benefiting from its advantages. Results are validated by comparing their results against reference orthogroups retrieved from the YGOB database. Results were compared with previous studies.
Descripción
Palabras clave
Detección de Ortólogos, Clasificación Basada en Conjuntos Aproximados, Problema de Desbalance, Evaluación de Algoritmos, Ortholog Detection, Classification Based in Rough Sets, Imbalance Problem, Algorithm Benchmarking