Base de datos y aplicación Web para la consulta de la relación de ortología entre dos especies.
Archivos
Fecha
2011-07-02
Autores
Rojas Peñate, Landy
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central “Marta Abreu” de Las Villas
Resumen
La variedad de formatos en la presentación de resultados de ortología de las bases de datos disponibles en la Web requiere de soluciones integradoras que faciliten la consulta de la información y faciliten la comparación de los algoritmos de detección de ortólogos en cuanto a su precisión. Además, el conocimiento almacenado en las distintas bases de datos puede servir de fundamento para nuevos y más precisos algoritmos de predicción de genes ortólogos. Debido a esto, proponemos técnicas de combinación de agrupamientos para obtener agrupamientos de consenso más precisos a partir de la consulta de la diversidad.
La aplicación que se presenta en este trabajo pretende agrupar resultados de algoritmos en un repositorio actualizable a través de archivos OrthoXML. La base de datos fue poblada con datos de los genomas S.Cerevisiae y S.Pombe procesados por algoritmos propios para los formatos de INPARANOID 7.0, Sanger versión 2.0 y KOG. Además, esta aplicación implementa medidas externas de calidad de agrupamientos aplicables a los agrupamientos en el repositorio y a sus combinaciones.
The variety of the formats in the ortology databases available in Internet requires the emergence of some integration solutions to facilitate the queries of these data sources and the comparison of the precision of the corresponding ortholog detection algorithms. The knowledge stored in these resources should be useful for the development of more accurate otholog detection algorithms. That is why; we propose the use of some ensemble techniques to obtain consensus clustering through the diversity study. The Web application we propose in this project is connected to a new repository updatable through OrthoXML files and web services. The database was filled with data from S.Cerevisiae and S.Pombe genomes processed by appropriate algorithms for the INPARANOID 7.0’s, Sanger version 2.0’s and KOG’s formats. Furthermore, the application implements some clustering quality measures to be applied to the algorithm results in the repository and their ensembles.
The variety of the formats in the ortology databases available in Internet requires the emergence of some integration solutions to facilitate the queries of these data sources and the comparison of the precision of the corresponding ortholog detection algorithms. The knowledge stored in these resources should be useful for the development of more accurate otholog detection algorithms. That is why; we propose the use of some ensemble techniques to obtain consensus clustering through the diversity study. The Web application we propose in this project is connected to a new repository updatable through OrthoXML files and web services. The database was filled with data from S.Cerevisiae and S.Pombe genomes processed by appropriate algorithms for the INPARANOID 7.0’s, Sanger version 2.0’s and KOG’s formats. Furthermore, the application implements some clustering quality measures to be applied to the algorithm results in the repository and their ensembles.
Descripción
Palabras clave
Base de Datos, Aplicación Web, Consulta de la Información, Relación de Ortología, Especies, Grupo de Bioinformática, Universidad Central Marta Abreu de Las Villas (UCLV)