Useparator: una herramienta para separación de genes en hongos y plantas
Fecha
2008-03-04
Autores
Pham Anh, Doi
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central “Marta Abreu” de Las Villas
Resumen
En este trabajo se describe la implementación de USeparator: un algoritmo basado en un Modelo Oculto de Markov aplicado a la problemática de la separación de secuencias de ADN de plantas y hongos fitopatógenos. USeparator basa su clasificación en la modelación de las diferencias en el uso de codones en ambos organismos. Además introduce un nuevo concepto de penalización de los codones de parada en los segmentos de ADN analizados que permite rechazar los ORF (-del inglés Open Reading Frame) incorrectos. Dicho algoritmo presentó un mejor poder de clasificación al compararlo con otros reportados en la literatura con el mismo fin. Entre estos últimos se encuentran modelos probabilísticos simples y otros basados en Support Vector Machines. Para la implementación del algoritmo se usó el paquete de programación BioJava y otros paquetes propios del lenguaje de programación Java como Hibernate, Hsqldb y otros. El empleo de estas herramientas resulta muy apropiado pues facilita el trabajo con diferentes formatos de secuencias biológicas así como la creación de bases de datos asociadas. Con este trabajo incorporamos una herramienta mejorada que se puede emplear en flujos de trabajo de proyectos de investigación en Biología Molecular, Fitopatología y Bioinformática.
Descripción
Palabras clave
USeparator, Algoritmo, Modelo Oculto de Markov, ORF (Open Reading Frame), BioJava